BittWare合作夥伴計劃成員

格羅奇

即時AI加速

專為超低延遲應用程式設計的確定性 ML 推理晶片。

新:從貿澤購買GroqCard™ Accelerator!

主要特點

完全確定性處理器

可預測和可重複的性能,無運行間變化

230 MB 片上記憶體

大型全域可共用SRAM,無需外部記憶體即可實現對模型參數的高頻寬、低延遲訪問

高達 80 TB 的片上記憶體頻寬

海量併發和數據
帶寬敏感型應用的並行性

9 個 RealScale™ 晶片對晶片連接器

近線性的多伺服器和多機架可擴展性,無需外部交換機

端到端片上保護

通過貫穿整個 GroqChip™ 數據路徑的糾錯碼 (ECC) 保護提高正常運行時間和可靠性

PCIe Gen4 x16 介面

行業標準介面中高達 31.5GB/s 的雙向頻寬,可實現快速設備和網路連接

準備好開始了嗎?

BittWare提供了幾種獲取Groq AI推理的途徑,無論您是在開發中還是準備部署:

格羅卡

格羅卡™加速器

當您通過貿澤獲得可用性時,一切準備就緒。

太盒 ™

高密度伺服器,帶有預集成卡和全面的保修。

拿著定製卡片概念圖片的男人

定製設計

BittWare擁有30 +年的經驗,提供定製的解決方案和外形尺寸。

準備,設置,完成。保證低延遲。

對於機器學習推理,GPU 效率低下,導致延遲、矽資源使用率低和性能不可預測。Groq 專門設計了其 AI 深度學習晶片,以提供可預測、高效、低延遲的推理,輕鬆引入您當前的工作流程。

易於集成,可擴展

GroqCard 是一款雙寬 PCIe 外形的 ML 加速器,可以輕鬆集成。GroqWare套件遵循軟體定義的硬體方法,為您的PyTorch,TensorFlow和ONNX訓練的深度學習模型提供簡單的部署路徑。

可擴充性是GroqCard的核心功能,具有9個RealScale晶片到晶片連接,可確保部署多個卡與一個卡一樣高效。內部軟體定義網路提供可預測、可重複的性能,沒有運行間的變化。

簡化程式設計

格羅克韋爾™套件

GroqWare Suite 是一個全面且多功能的軟體堆疊,旨在加速各種 HPC 和 ML 工作負載。該套件由 Groq 編譯器、Groq™ API 和實用程式組成,通過開源驅動程式/運行時和對行業標準 AI/ML 框架的支援來簡化部署實現。

GroqFlow 工具鏈(包含在 GroqWare 套件中)使單行 Pytorch 或 TensorFlow™ 代碼能夠通過全自動工具鏈導入和轉換現有模型,以便在 Groq 硬體上運行。

查看您的程式在 GroqChip 上的傳輸

 

什麼是 GroqChip™ 處理器?

專為全新打造的可擴展處理器 以加速 AI、ML 和 HPC 工作負載。

革命性的、完全確定性的 GroqChip 處理器是可擴展性能的核心。GroqChip 從頭開始構建,可加速 AI、ML 和 HPC 工作負載,可減少數據移動,實現可預測的低延遲性能,無瓶頸。這款獨立晶片可靈活集成到計算密集型應用中。

該架構比 GPU 簡單得多,並且以軟體為重點進行設計,使其更易於程式設計,並以更低的延遲提供可預測的性能。

主要應用

財力

科學與政府

工業

石油和天然氣

格羅卡

PCIe 卡規格

外形尺寸

雙寬、全高、3/4 長度 PCI Express Gen4 x16 適配器

性能

高達 750 個 TOP,188 個 TFLOP(INT8、FP16 @900 MHz)

記憶

每個晶片 230 MB 靜態存儲記憶體

高達 80 TB/s 的片上記憶體頻寬

晶片縮放

多達 9 個 RealScale™ 晶片到晶片連接器

數位

INT8、INT16、INT32 和 TruePoint™ 技術 MXM: FP32
VXM: FP16, FP32

權力

最大:375W;TDP: 275 ;典型值:240W

尋找PCIe?

設計+製造 來自 BittWare,Molex 公司

BittWare可以為您的部署設計和製造正確的外形尺寸。 

準備好購買了嗎?

本產品可從貿澤電子在線訂購。 在貿澤網站上索取報價:

準備好獲取更多資訊了嗎?

填寫表格以取得聯繫,瞭解有關 Groq 即時 AI 加速的詳細資訊。