在邊緣加速 AI 推理

什麼是MERA，DNA和SAKURA-I？

MERA編譯器框架：

MERA編譯器和軟體框架是一種不折不扣的超低延遲解決方案，可以優化SAKURA-I和FPGA支援的異構系統的工作負載。
利用MERA，意味著您可能不需要重新訓練模型即可利用DNA IP加速。

動態神經加速器（DNA）：

神經處理引擎IP

通過獲得專利的“可重構數據路徑技術”實現接近最佳的計算利用率，從而在低批量大小下實現 AI 處理器計算元素的最高利用率。
結合MERA編譯器框架，可在任何硬體平臺（SAKURA-I或 FPGA）上以更低的功耗提供高輸送量和更低的延遲。

櫻花-I

一款革命性的全新 40 TOPS、10W TDP 人工智慧協處理器晶片，專門設計用於實現比領先 GPU 更高的能效幾個數量級。
SAKURA 經過硬體設計和優化，可運行DNA架構，使其能夠以超低延遲同時運行多個深度神經網路模型，同時保持出色的 TOPS利用率。

視頻

超快速 Yolov5 物體檢測與邊緣皮質櫻-I

選擇正確的解決方案

想要加速邊緣 AI 工作負載？有許多入門選項，無論您是處於早期開發階段還是準備在複雜模塊上進行批量生產。

概述：EdgeCortix SAKURA-I，同類最佳的節能邊緣AI協處理器

EdgeCortix SAKURA-I是一款TSMC 12nm FinFET協處理器（加速器），為邊緣人工智慧（AI）推理提供一流的計算效率和延遲。它由每秒40萬億次操作（TOPS）單核動態神經加速器®（DNA）智慧財產權（IP）提供支援，這是EdgeCortix專有的神經處理引擎，內置運行時可重新配置的數據路徑，將所有計算引擎連接在一起。DNA 使新的 SAKURA-I AI 協處理器能夠以超低延遲同時運行多個深度神經網路模型，同時保持出色的 TOPS 利用率。這種獨特的屬性是提高片上系統的處理速度、能效和使用壽命的關鍵，可提供卓越的總擁有成本優勢。DNA IP 專門針對流和高解析度數據的推理進行了優化。

硬體架構概述

多達 40 個 TOPS（單晶片）和 200 個 TOPS（多晶片）
PCIe 設備 TDP @ 10W-15W
典型型號功耗 ~5W
2×64 LPDDR4x – 16 GB
PCIe Gen 3 高達 16 GB/s 的頻寬
兩種外形 – 雙 M.2 和薄型 PCIe
運行時可重新配置的數據路徑

SAKURA-I 數據表

下載

行業

汽車

國防與安全

機器人與無人機

智慧城市

智能製造

EdgeCortix MERA編譯器和軟體

EdgeCortix SAKURA-I AI 支援協處理器的設備由異構編譯器和軟體框架 - EdgeCortix MERA 支援，可以從公共 pip 儲存庫安裝，從而實現在行業標準框架中開發的標準或自定義卷積神經網路（CNN）的無縫編譯和執行。MERA內置了與Apache TVM的集成，並提供簡單的API，使用SAKURA-I中的DNA AI引擎無縫實現深度神經網路圖的編譯和推理。它提供了在簡單的校準和量化步驟后部署任何預先訓練的深度神經網路所需的分析工具、代碼生成器和運行時。MERA支援直接在深度學習框架中量化的模型，例如Pytorch或TensorflowLite。

SAKURA-I Edge AI平台規格和性能指標：

多樣化的操作員支援

標準卷積和深度卷積
步幅和擴張
對稱/非對稱填充
最大池化，平均池化
ReLU， ReLU6， LeakyReLU， H-Swish和H-Sigmoid
上採樣和下採樣
殘餘連接、拆分等

GPU 的直接替代品

Python 和 C++ 介面
原生支援 PyTorch 和 TensorFlow-lite
無需再培訓
支援高解析度輸入

INT8 位量化

訓練后校準和量化
支援深度學習框架內置量化器
保持高精度

內置模擬器

在沒有SAKURA-I設備的情況下部署，類比
x86 環境中的推理
估計推理延遲和輸送量低於
不同的條件

準備好獲取更多資訊了嗎？

填寫表格以獲取有關EdgeCortix AI加速解決方案的更多資訊。

“*”表示必填欄位

姓名*

第一最後

電子郵件*

電話

如果我們可以通過電話與您聯繫，請提供除電子郵件外的電話號碼。

公司事業部

公司/組織

如果您要求定價，請提供公司/組織名稱。

隱藏

位址和城市

街道位址位址行 2 城市郵編 / 郵遞遞區編碼

國家*

將查詢定向到正確團隊的必填欄位

國家

美國州*

州

加拿大省*

省

我們如何為您提供説明？

BittWare合作夥伴計劃成員