
FPGA-Beschleunigung von binär gewichteten neuronalen Netzen
White Paper FPGA Acceleration of Binary Weighted Neural Network Inference One of the features of YOLOv3 is multiple-object recognition in a single image. We used
Der GROVF RDMA IP-Kern und die Host-Treiber bieten RDMA over Converged Ethernet (RoCE v2) Systemimplementierung und Integration mit Standard Verbs API. Die RDMA-IP wird mit einem Referenzdesign geliefert, das das IP-Subsystem selbst, das 100G-MAC-IP-Subsystem, das DMA-Subsystem, Host-Treiber und eine Beispielanwendung in Software enthält. Die Systemtreiber sind mit der OFED-Standard-Verbs-API integriert und sind mit bekannten RNIC-Karten und -Software kompatibel. Der IP-Kern bietet auch eine FPGA-Implementierung von RoCE v2 mit niedriger Latenz und einem Durchsatz von 100 Gbit/s.
Die Lösung ist eine Soft-IP, die das Protokoll RDMA over Converged Ethernet implementiert. Sie besteht aus einer FPGA-IP, die mit MAC und DMA integriert ist, sowie den Host-CPU-Treibern. Die IP ist kompatibel mit den XUP-VV8 und XUP-P3R FPGA-Karten von BittWare, die mit Xilinx UltraScale+ FPGAs ausgestattet sind. Die Lösung erfüllt die Anforderungen von Channel Adapter und RoCE v2, wie sie in der IB-Spezifikation festgelegt sind. Das Diagramm auf Seite 1 zeigt einen vereinfachten Überblick über die Architektur des Systems. Die Datenebene und die zuverlässige Kommunikation sind hardwaremäßig ausgelagert, und die Implementierung enthält keine CPU-Cores im FPGA.
Das Referenzbeispiel besteht aus drei Teilen:
Gerät | LUTs | On-Chip-Speicher |
---|---|---|
UltraScale+ VU9P | 110K | 15Mb |
Unser technisches Vertriebsteam steht bereit, um Ihnen Informationen zur Verfügbarkeit und Konfiguration zu geben oder Ihre technischen Fragen zu beantworten.
"*" kennzeichnet Pflichtfelder
White Paper FPGA Acceleration of Binary Weighted Neural Network Inference One of the features of YOLOv3 is multiple-object recognition in a single image. We used
PCIe FPGA Card XUP-PL4 UltraScale+ FPGA Low-Profile PCIe Card Dual QSFP28s and DDR4 Need a Price Quote? Jump to Pricing Form Ready to Buy? Check
PCIe FPGA Card XUP-P3R Xilinx UltraScale+ 3/4-Length PCIe Board 4x 100GbE and up to 512GB DDR4 Need a Price Quote? Jump to Pricing Form Ready
PCIe FPGA Card 520N-MX Stratix 10 FPGA Board with 16GB HBM2 Powerful solution for accelerating memory-bound applications Need a Price Quote? Jump to Pricing