BittWare用于网络包处理的SmartNIC外壳介绍
白皮书 BittWare用于网络数据包处理的SmartNIC Shell简介 SmartNIC Shell是一个完整的工作网卡,在BittWare平台上实现。
Eideticom的查询处理单元(QPU)针对数据库用户或任何需要在硬件中以低延迟完成查询、分析或格式转换的流媒体数据(如网络数据包)。任务可以并行化,以满足任何带宽需求,并与其他NoLoad®功能如压缩混合。
作为Eideticom的NoLoad计算存储框架的一部分,QPU可以与Eideticom的其他计算存储IP进行管道连接,如压缩、解压缩擦写编码和重复数据删除。
解除了硬件工程师参与指定QPU参数的负担,用户使用片上处理器定义功能。这既提供了高级工具的易用性,又减轻了主控CPU的负担。
QPU包括格式转换(文本到/从二进制)或标准驱动的数据库功能。用户在软件中设计他们的功能组合,不需要基于硬件的工具。QPU将支持一系列数据库工具的原生加速,因为这些软件包将支持基于标准的计算存储。
用软件定义的搜索和过滤参数进行数据查询。
对流媒体数据进行过滤、模式匹配和分析,如网络包头或SSD存储上的数据。
对文本/二进制数据进行高效的重新格式化或其他格式转换。
我是Sean Gibb,Eideticom的工程副总裁。在本视频中,我们将演示如何使用Eideticom的查询处理单元,即QPU,来格式化和过滤以逗号分隔的文本格式存储的股票行情数据。
Eideticom的QPU中的嵌入式处理器可使用C或C++进行软件编程,使您能够动态地编制过滤功能。
除了嵌入式处理器外,您的嵌入式软件还可使用易于使用的高吞吐量硬件协处理器(执行常见任务,如数据包捕获分析、从文本到二进制格式的转换以及简单过滤),以加速您的查询工作负载。
在这个例子中,我们使用文本到二进制格式化器将CSV转换为二进制数据,执行一个运行时间可配置的硬件过滤器(以过滤掉特定的股票符号和低成交量的交易),然后执行一个软件过滤器,删除当天收盘价低于开盘价的所有交易。
我们使用GCC编译器编译软件,产生一个可执行文件,我们可以通过我们的软件栈加载到嵌入式处理器。一旦软件加载完毕,我们通过查询引擎运行5GB的CSV数据,过滤所有体积超过1000万的微软股票。
你可以在这里看到,一个查询引擎能够维持2GB/s的文本输入。我们可以铺设多个查询引擎,并且由于Eideticom的软件堆栈,用同一个主机软件使FPGA卡的PCIe接口饱和。
这只是Eideticom的软件可编程、硬件加速的QPU能够为你做的一个例子。
查询处理单元在软件中定义,在FPGA上运行(使用软或硬处理器),消除了对低级配置工程资源的需求。
QPU是模块化的,允许放置一个或多个单元以满足一定的带宽要求。QPU实例可以合作,例如,在八个QPU上进行分布式文件转换,需要协调跨越两个单元的数据。
查询处理单元是NoLoad框架的一个组件。橙色的压缩等组件是用户使用软件定义的方法建立他们的特定应用。
像压缩这样的组件可以被添加到QPU中,例如,在转移到SSD存储之前,对过滤的数据进行压缩。
所有显示的加速器功能都在FPGA硬件中实现,允许高带宽、低延时和CPU卸载。
这个现实世界的例子使用查询处理单元作为数据包处理机,加上压缩引擎(另一个NoLoad® IP核)。数据包被压缩并使用点对点传输写入固态硬盘阵列,同时QPU还拉出头(网络元组)数据和一些分析,如每个时间段的数据包计数。分析结果以CSV数据的形式发送到主机。
与多线程的英特尔至强CPU相比,数据库查询处理单元的性能如下所示。
平均值。数据包大小 | CPU | 1×查询引擎(QE) | 2×QE | 4×QE |
---|---|---|---|---|
256B | 0.2 GB/s | 1.8 GB/s | 3.6 GB/s | 7.2 GB/s |
1024B | 0.7 GB/s | 2.0 GB/s | 4.0 GB/s | 8.0 GB/s |
4096B | 1.9 GB/s | 2.0 GB/s | 4.0 GB/s | 8.0 GB/s |
9216B | 2.7 GB/s | 2.0 GB/s | 4.0 GB/s | 8.0 GB/s |
在数据库加速配置中,查询处理单元可以执行从CPU卸载到数据类型格式转换的一系列功能。
查询处理单元的目标是BittWare的带有Intel Agilex FPGA的卡。
我们的技术销售团队随时准备提供可用性和配置信息,或回答您的技术问题。
"*"表示必填项目
白皮书 BittWare用于网络数据包处理的SmartNIC Shell简介 SmartNIC Shell是一个完整的工作网卡,在BittWare平台上实现。
来自Atomic Rules的PCIe Gen4数据移动器IP。使用BittWare的PCIe Gen4卡实现高达220 Gb/s的速度,当你需要比标准DMA更多的性能时,可以节省你的开发团队。特点:DPDK和AXI标准,与数据包或任何其他数据格式一起工作,在任何线速下运行,最高可达400GbE。
BittWare合作伙伴IP TimeServo IP核 高性能系统定时器IP Atomic Rules的TimeServo IP核是一个RTL IP核,用于