BittWare パートナープログラム会員

エッジでのAI推論を加速させる

エッジコルティクスさくらAIコプロセッサ

現在と同じモデルやワークロードを、より低いレイテンシーと優れた電力効率で実行できる

TensorFlowロゴ
ONNXロゴ
PyTorchロゴ

MERA」「DNA」「SAKURA-I」とは?

MERAコンパイラフレームワーク:

  • MERAコンパイラとソフトウェアフレームワークは、SAKURA-IとFPGAがサポートするヘテロジニアスシステムのワークロードを最適化する、妥協のない超低レイテンシソリューションです。
  • MERAを活用することで、DNA IPアクセラレーション を活用するためにモデルを再トレーニングする必要はないでしょう。

Dynamic Neural Accelerator(DNA)です:

ニューラル・プロセッシング・エンジンIP

  • 特許取得済みの「リコンフィギュラブル・データパス技術」により、最適に近い演算効率を実現し、少ないバッチサイズでもAIプロセッサの演算素子を最大限に活用できます。
  • MERAコンパイラフレームワークとの組み合わせにより、SAKURA-IやFPGAなどのハードウェアプラットフォームで、高いスループットと低レイテンシーを低消費電力で実現します。

SAKURA-I

  • 40TOPS、TDP10Wの革新的な新型AIコプロセッサ・チップは、主要なGPUと比較して桁違いに優れたエネルギー効率を達成するために特別に設計されたものである。
  • SAKURAは、DNAアーキテクチャを実行するためにハードウェア設計され、最適化されているため、TOPSの優れた利用率を維持しながら、超低レイテンシーで、複数のディープニューラルネットワークモデルを一緒に実行することができます。

動画

EdgeCortix SAKURA-Iによる超高速Yolov5物体検出。

適切なソリューションの選択

エッジAIのワークロードを加速させたいとお考えですか?初期段階の開発でも、複雑なモジュールの量産準備でも、始めるための多くのオプションがあります。

EdgeCortix Sakura I PCIeカード

SAKURA-I ASIC開発キット

ベンチトップ開発に最適な薄型PCIeカードにSAKURA-Iチップを搭載。SAKURA-IにDNAニューラル処理エンジンを組み込んだMERAコンパイラフレームワークとツールを搭載。

IA-420f PCIeカード

FPGAアクセラレータカード

MERA Compiler Frameworkとツール、DNA神経処理エンジンIPを含み、IntelAgilex 7 FPGAを搭載したBittWare'sのPCIeアクセラレータカードにバンドルされています。本ソリューションの詳細については、こちらをご覧ください。

ISIカスタムモジュール

カスタムカードまたはマイクロエレクトロニクスモジュール

電力効率に優れたASICなら、カスタマイズされたカードやマイクロエレクトロニクスモジュールが完璧にフィットします。

概要クラス最高のエネルギー効率を誇るEdgeCortix SAKURA-I エッジAIコプロセッサー

EdgeCortix SAKURA-Iは、TSMC 12nm FinFETコプロセッサ(アクセラレータ)です。(アクセラレータ)であり、クラス最高の計算効率を実現します。 エッジ人工知能(AI)推論のためのクラス最高の計算効率とレイテンシを実現するコプロセッサ(アクセラレータ)です。40兆回/秒(TOPS)の演算性能を備えています、 シングルコア ダイナミック・ニューラル・アクセラレータ®(DNA (DNA)知的財産(IP)を搭載しています。これは、EdgeCortixが独自に開発したニューラル処理エンジンです。 このエンジンは、すべてのコンピュートエンジンをつなぐランタイム再構成可能なデータパスを内蔵しています。DNA により、SAKURA-I AIコプロセッサは、複数のディープニューラルネットワークモデルを超低レイテンシで同時に実行することができます。 TOPSの利用率を維持しながら、超低レイテンシーで複数のディープニューラルネットワークモデルを実行することができます。このユニークな特性は、処理速度を向上させる鍵となります、 このユニークな特性は、システムオンチップの処理速度、エネルギー効率、寿命を向上させ、優れた総所有コスト(TCO)メリットを提供する鍵となります。DNA IPは、特にストリーミングデータや高解像度データの推論に最適化されています。

 

ハードウェア・アーキテクチャの概要

ダイナミック・ニューラル・アクセラレータ・ブロック図
  • 最大40TOPS(シングルチップ)、最大200TOPS(マルチチップ)。
  • PCIeデバイスのTDP @ 10W-15W
  • 代表的なモデル 消費電力 ~5W
  • 2×64 LPDDR4x - 16 GB
  • PCIe Gen 3 最大16GB/sの帯域幅を実現。
  • デュアルM.2とLow-profile PCIeの2つのフォームファクター
  • ランタイム再変更可能なデータパス

インダストリーズ

オートモーティブ

防衛・安全保障

ロボティクス&ドローン

スマートシティ

スマートマニュファクチャリング

EdgeCortix MERAコンパイラおよびソフトウェア

EdgeCortix SAKURA-I AIコプロセッサ対応デバイスは、ヘテロジニアスコンパイラとソフトウェアフレームワークであるEdgeCortix MERAをサポートしており、公開されているpipリポジトリからインストールすることで、業界標準のフレームワークで開発した標準またはカスタム畳み込みニューラルネットワーク(CNN)をシームレスに編集・実行できます。MERAは、Apache TVMとの統合を内蔵しており、SAKURA-IのDNA AIエンジンを用いたディープニューラルネットワークグラフのコンパイルと推論をシームレスに実現するシンプルなAPIを提供します。MERAは、簡単なキャリブレーションと量子化ステップを経て、事前に訓練されたディープニューラルネットワークを展開するために必要なプロファイリングツール、コードジェネレーター、ランタイムを提供します。MERAは、PytorchやTensorflowLiteなどの深層学習フレームワークでモデルを直接量子化することをサポートしています。  

EdgeCortix MERAコンパイラとソフトウェアのブロック図

SAKURA-I Edge AI Platformの仕様と性能指標:

多様なオペレーターに対応

  • 標準的畳み込みおよびDepthwise畳み込み 
  • ストライドとダイレーション
  • 対称/非対称のパディング
  • 最大値プーリング、平均プーリング
  • ReLU、ReLU6、LeakyReLU、H-Swish、H-Sigmoid
  • アップサンプリング・ダウンサンプリング
  • 残差接続、分岐など 

GPUのドロップイン置き換え

  • PythonおよびC++インターフェース
  • PyTorchとTensorFlow-liteをネイティブでサポート。
  • 再トレーニング不要
  • ハイレゾ入力をサポート 

INT8bit 量子化

  • トレーニング後のキャリブレーションと量子化
  • ディープラーニングのフレームワークに組み込まれた量子化機能のサポート
  • 高い精度を維持する

内蔵シミュレーター

  • SAKURA-Iデバイスを使用せず、x86環境下で
    推論をシミュレートして展開する。

  • 異なる条件下での推論レイテンシとスループットを推定する。
EdgeCortixとNVIDIAの性能比較

詳細な情報については、こちらをご覧ください。

EdgeCortix AIアクセラレーション ソリューションの詳細については、フォームに必要事項をご記入の上、お問い合わせください。