BittWare合作夥伴計劃成員

在邊緣加速 AI 推理

Edgecortix Sakura AI 協處理器

以更低的延遲和更高的能效運行您目前運行的相同模型和工作負載

TensorFlow 徽標
ONNX 徽標
PyTorch 徽標

什麼是MERA,DNA和SAKURA-I?

MERA編譯器框架:

  • MERA編譯器和軟體框架是一種不折不扣的超低延遲解決方案,可以優化SAKURA-I和FPGA支援的異構系統的工作負載。
  • 利用MERA,意味著您可能不需要重新訓練模型即可利用DNA IP加速。

動態神經加速器(DNA):

神經處理引擎IP

  • 通過獲得專利的“可重構數據路徑技術”實現接近最佳的計算利用率,從而在低批量大小下實現 AI 處理器計算元素的最高利用率。
  • 結合MERA編譯器框架,可在任何硬體平臺(SAKURA-I或 FPGA)上以更低的功耗提供高輸送量和更低的延遲。

櫻花-I

  • 一款革命性的全新 40 TOPS、10W TDP 人工智慧協處理器晶片,專門設計用於實現比領先 GPU 更高的能效幾個數量級。
  • SAKURA 經過硬體設計和優化,可運行DNA架構,使其能夠以超低延遲同時運行多個深度神經網路模型,同時保持出色的 TOPS利用率。

視頻

超快速 Yolov5 物體檢測與邊緣皮質櫻-I

選擇正確的解決方案

想要加速邊緣 AI 工作負載?有許多入門選項,無論您是處於早期開發階段還是準備在複雜模塊上進行批量生產。

EdgeCortix Sakura I PCIe卡

櫻花 A ASIC 開發套件

將 SAKURA-I 晶片安裝在一款非常適合台式開發的薄型 PCIe 卡上。包括 MERA 編譯器框架和工具,以及嵌入到 SAKURA-I 中的 DNA 神經處理引擎。

IA-420f PCIe卡

FPGA 加速卡

包括 MERA 編譯器框架和工具、DNA 神經處理引擎 IP,與採用英特爾 Agilex 7 FPGA 的 BittWare PCIe 加速器卡捆綁在一起。 有關此解決方案的更多詳細資訊,請按兩下此處。

ISI 定製模組

定製卡或微電子模組

借助高能效的ASIC,定製卡或微電子模組是完美的選擇。

概述:EdgeCortix SAKURA-I,同類最佳的節能邊緣AI協處理器

EdgeCortix SAKURA-I是一款TSMC 12nm FinFET協處理器加速器),為邊緣人工智慧(AI)推理提供一流的計算效率和延遲。它由每秒40萬億次操作(TOPS)單動態神經加速器®DNA)智慧財產權(IP)提供支援,這是EdgeCortix專有的神經處理引擎,內置運行時可重新配置的數據路徑,將所有計算引擎連接在一起。DNA 使新的 SAKURA-I AI 協處理器能夠以超低延遲同時運行多個深度神經網路模型,同時保持出色的 TOPS 利用率。這種獨特的屬性是提高片上系統的處理速度、能效和使用壽命的關鍵,可提供卓越的總擁有成本優勢。DNA IP 專門針對流和高解析度數據的推理進行了優化。

 

硬體架構概述

動態神經加速器框圖
  • 多達 40 個 TOPS(單晶片)和 200 個 TOPS(多晶片)
  • PCIe 設備 TDP @ 10W-15W
  • 典型型號 功耗 ~5W
  • 2×64 LPDDR4x – 16 GB
  • PCIe Gen 3 高達 16 GB/s 的頻寬
  • 兩種外形 – 雙 M.2 和薄型 PCIe
  • 運行時可重新配置的數據路徑

行業

汽車

國防與安全

機器人與無人機

智慧城市

智能製造

EdgeCortix MERA編譯器和軟體

EdgeCortix SAKURA-I AI 支援協處理器的設備由異構編譯器和軟體框架 - EdgeCortix MERA 支援,可以從公共 pip 儲存庫安裝,從而實現在行業標準框架中開發的標準或自定義卷積神經網路 (CNN) 的無縫編譯和執行。MERA內置了與Apache TVM的集成,並提供簡單的API,使用SAKURA-I中的DNA AI引擎無縫實現深度神經網路圖的編譯和推理。它提供了在簡單的校準和量化步驟后部署任何預先訓練的深度神經網路所需的分析工具、代碼生成器和運行時。MERA支援直接在深度學習框架中量化的模型,例如Pytorch或TensorflowLite。  

EdgeCortix MERA 編譯器和軟體框圖

SAKURA-I Edge AI平台規格和性能指標:

多樣化的操作員支援

  • 標準卷積和深度卷積 
  • 步幅和擴張
  • 對稱/非對稱填充
  • 最大池化,平均池化
  • ReLU, ReLU6, LeakyReLU, H-Swish和H-Sigmoid
  • 上採樣和下採樣
  • 殘餘連接、拆分等 

GPU 的直接替代品

  • Python 和 C++ 介面
  • 原生支援 PyTorch 和 TensorFlow-lite
  • 無需再培訓
  • 支援高解析度輸入 

INT8 位量化

  • 訓練后校準和量化
  • 支援深度學習框架內置量化器
  • 保持高精度

內置模擬器

  • 在沒有SAKURA-I設備的情況下部署,類比
    x86 環境中的推理
  • 估計推理延遲和輸送量低於
    不同的條件
EdgeCortix vs NVIDIA 性能的比較

準備好獲取更多資訊了嗎?

填寫表格以獲取有關EdgeCortix AI加速解決方案的更多資訊。