参考设计
AI金融交易模型的MAU加速器
超低延迟、高吞吐量的机器学习推理
Myrtle.ai MAU加速器非常适合金融服务领域的一系列应用,其部署场景从同地办公到离线,以IP形式提供,可在最新的FPGA上运行。
市场数据预测
量化交易
算法交易
什么是MAU加速器IP?
该IP旨在集成到您现有的软件栈中,支持浮点、块浮点、脑浮点和整数格式的各种位深。在流行的框架中开发的现有模型可以使用ONNX OSI格式导入。
系统实例
轻轻敲击来放大
业绩实例
- Acceleration of a trading algorithm, using an LSTM-based neural network model with ~10k parameters, achieves a latency of <1µs per timestep, a throughput of over 700k timesteps per second and a capacity of 150 models per accelerator card.
- 一个小型的、64个节点的、堆叠的LSTM模型的加速,有2个LSTM层和~3M的参数和20个时间步长,实现了9µs的推理延迟。
关于Myrtle.ai
Myrtle.ai在使用FPGA加速器卡对ML模型(如RNN和LSTM网络)进行有效的硬件加速方面拥有相当丰富的经验。这些设计是为了实现最高的吞吐量和最低的成本,用于具有非常严格的延迟限制的推理工作负载。
可交付的成果
PyTorch中的开源参考模型和导出脚本
推理的应用代码示例
MAU加速器推理API的C和Python绑定
FPGA位流和源代码(有条件的)。
为BittWare硬件设计
MAU加速器参考设计可以在一系列采用英特尔和Xilinx FPGA的BittWare产品上运行。对于部署,我们推荐超高密度的TeraBox 1401B,有四块卡和一个AMD EPYC CPU。
获取更多关于MAU性能的细节!
要求召开会议,深入了解MAU加速器IP如何为你的组织工作!
预览我们将分享的材料:
"*"表示必填项目