小组讨论

今天的FPGA如何解决数据泛滥的问题

从第五代到人工智能,从NOC到边缘的射频

在下面免费观看录音!

技术驱动的进步,如5G和自动驾驶汽车,正在产生一个数据洪流,超出了当前一代移动、存储和处理这些信息的解决方案。值得庆幸的是,在这些具有挑战性的领域正在出现一系列新的进展,包括用于数据移动的PCIe Gen5,用于自动分析处理的AI,以及更强大的边缘处理。

这些领域的三位专家将以硬件和软件/IP的具体例子讨论这些新兴的解决方案,重点是基于FPGA的解决方案。演讲将以小组讨论的形式进行,现场参会人员有机会通过聊天提问。今天就注册,加入我们的直播吧

FPGA加速器卡

520N-MX PCIe 卡照片
520N-MX
IA-420f 卡
IA-420f
IA-860m

合作伙伴知识产权

发言人

杰夫-米罗德照片
Jeff Milrod - BittWare首席技术和战略官
Shep Siegel 照片
Shepard Siegel | CTO,Atomic Rules
斯蒂芬-贝茨头像
史蒂芬-贝茨-- Eideticom首席技术官
 

布赖恩

谢谢你今天加入我们。我是Bryan DeLuca,和Nicolette Emmino一起,我们将是今天这个现场聊天的主持人,"今天的FPGA是如何解决数据泛滥问题的",由Mouser Electronics、BittWare和Molex赞助。

我们有一些很好的小组成员,这是一个实时聊天,所以请确保你在屏幕底部的问答中提出你的问题。现在有请Nicolette。

尼科勒特

嗨,伙计们。再次感谢你们加入我们。我们这里有三位小组成员,BittWare公司的首席技术和战略官Jeff Milrod。Steven Bates,Eideticom的首席技术官。Shep Siegel, Atomic Rules的首席技术官。

这三位专家将以硬件和软件IP的具体例子来讨论这些新兴的解决方案,重点是FPGA解决方案。

因此,让我们潜心研究,我们将以一点背景情况为开端。你们觉得怎么样,伙计们?

那么,你为什么不告诉我们--你知道,谢泼、杰夫、斯蒂芬--你为什么不告诉我们这三个组织......你们在一个新项目中合作?我们为什么不谈一谈这是如何服务于市场和你们的工作呢?

杰夫

好吧,我开始接受,因为BittWare几十年来一直在用FPGA制作硬件平台。我们所做的事情的性质是为这些应用提供一个平台。我们是平台方面的专家,但在应用和工作负载方面却不太擅长。从历史上看,我们把所谓的 "裸机 "卖给了我们的客户,他们是在FPGA上编码和开发应用的专家。

我们发现,客户越来越不愿意做FPGA编程的所有艰苦、繁重的工作。我们已经与IP和解决方案供应商合作,如Shep和Stephen,在我们稳定和成熟的硬件平台之上提供增值服务。

谢普

是的,杰夫,这很好,我就在这里插一句。因此,在Atomic Rules,我们作为FPGA社区的服务和IP供应商,没有切割蚀刻,也没有硬件,我们没有比BittWare更好的合作伙伴,可以提供来自所有重要供应商的尖端FPGA的平台,这样我们的IP就可以以最好的方式展示。

杰夫和BittWare/Molex对拥有IP的渴望与我们对拥有一个平台以提供我们想带给客户的价值的需求直接相遇。斯蒂芬?

史蒂芬

是的,当然,我将跳进去。所以,一个伟大的人曾经说过,你知道,对于一台计算机......一个计算机系统要真正发光,你需要两件事:你需要好的硬件和你需要好的软件。对于那些游戏玩家来说,一个很好的例子是,你可以去建立一个很棒的游戏PC,但你需要游戏开发者编写软件来运行在这个硬件上,对吗?

因此,当你有好的硬件和好的软件时,你会得到最好的客户体验。就像Jeff在讲话时提到的那样,我们,你知道,Molex/BittWare在建造伟大的硬件方面非常出色。他们可以建造市场上最好的FPGA卡,但是他们和客户在开发真正使硬件发光的优秀软件方面的能力越来越差。

而这正是像Shep's和我这样的公司介入的地方。因此,我们致力于开发在FPGA上运行的软件,但不仅仅是这个。还有,在主机系统上运行的软件,并将其连接到应用中,无论是存储应用、网络应用还是计算应用。我认为提供完整的解决方案是客户真正在寻找的东西:能够从像Jeff(BittWare/Molex)这样的公司和像Shep's和我这样的公司拿到现成的东西--并且有一些东西可以直接插入,只是工作和做一些非常,非常好的事情。

布赖恩

所以,我们已经谈了很多......我们已经谈了很多关于FPGA的灵活性,对吗?FPGA的灵活性如何?我的意思是,它们真的越来越容易编程了吗--如果不是,我们如何使用它们?杰夫,你能谈一谈这个问题吗?

杰夫

是的。它们非常灵活,而且越来越灵活意味着越来越难使用,实际上,我认为。而且,你知道,我只是在想,你知道,在谈论这个问题的时候,我的一个老的公理,你知道,一二十年前是 "BittWare把这种裸机FPGA硬件卖给了疯子边缘"。......谁是真正能够卷起袖子编写这种灵活的东西的人......现在不是卖给他们,而是与他们合作(笑)。

我会给Stephen和Shep的疯子边缘打电话(笑声)......然后我们一起......把一些非疯子能够真正消费和合理使用的东西放在一起。FPGA的灵活性是令人生畏的。事实上,它可以做任何事情,这意味着它本身什么都不做。因此,你知道,当它开机时,它甚至不知道如何使用内存或连接到它的主机。

这就是有很多工作要做,以建立框架,并有外壳或(不同的人使用不同的术语),然后应用程序和工作负载可以被加载到其中。

但即使如此,应用和工作负载,你知道,有这些,你知道,门的海洋(那是,你知道,现场可编程门阵列是FPGA的代表)......有,你知道,数以百万计的这些逻辑元素,你如何将它们连接起来做你的硬件算法和实现是极具挑战的。随着他们增加更多的选项和加固的内核,在那个空间做一个特定的工作负载变得更加具有挑战性。这就是,你知道,我们的疯子边缘伙伴进来的地方(笑)。

谢普

听着,不一定要这样--Jeff我同意--但也不一定要成为疯狂的边缘人。有所有这些......有许多优秀的工具在过去几年中不断成熟,使一头扎进数百万FPGA的艰巨任务变得更容易管理。因为工具已经变得更好了,但是对于那些问题在应用层面上的人来说,冲击FPGA的复杂性几乎是不可能的。这就是为什么像我、Stephen和其他公司有机会加入这个生态系统,在FPGA的原始蛮力之上建立一个平台。

我在FPGA CAD设计方面的英雄之一,Alberto Santelli,在ASIC出现的早期就谈到了基于平台的设计。但是,他在ASIC方面所宣扬和研究的内容在FPGA方面已经成为事实。我们经常使用叠加一词来描述一种能力--也许是Eideticom公司制造的,也许是Atomic Rules公司制造的,也许是电话会议上的一些人正在制造这些叠加--叠加作为平台分层在基本FPGA的硬件和软件之上,以提高抽象度,接近用户试图实现的目的。

Atomic Rules的业务是提供提供这些平台的产品。也许有人想移动数据,也许有人想做计算存储,也许有人有其他问题。这些IP核只是提高了交互水平,所以使用FPGA做真正的计算的工作不会立即被推到,你知道,查询表和时序验证......以及所有这些会扼杀发展的细节......而是被我们的能力所放大,"哦,你需要从网络到磁盘驱动器到主机移动数据?我们知道如何做到这一点,这就是这个电话......"是的,这下面有很多事情要做,但这就是像BittWare、Eideticom和Atomic Rules这样的公司所提供的价值。

史蒂芬

是的。所以,我不太确定我对被称为疯子的感觉。我的一部分喜欢它,一部分...

尼科勒特

(笑)杰夫,你真的触动了我的神经!

史蒂芬

我知道你做到了,不是吗,杰夫?我喜欢说的方式,我喜欢对我那些非极客的朋友说的方式是,"你知道什么是极客。那么,如果你去和一个极客交谈,告诉他们我是做什么的,他们会说我是一个极客。"(笑声)所以我是一个极客的平方或两个极客,或者我不知道。

布赖恩

我正想说同样的话--这就像怪胎的平方。

史蒂芬

所以,我认为Jeff和Shep很好地触及了这个问题。我的意思是,就 "我如何学习如何使用FPGA "而言,工具已经变得更好了。但是供应商提供的硅片的复杂性也在增加,可能比工具的速度更快。

而且我认为这些年来已经做了很多工作,使那些没有FPGA经验的人更容易让他们做一些事情。但这仍然是一个困难的问题,我不认为我们已经真正解决了这个问题。我们曾试图,你知道,为FPGA编写C型编程语言,就像Shep所说的:提高抽象层。这样做的问题是,你经常牺牲性能来获得这种便利。

因此,我认为像Shep和我这样的公司正在努力做更多特定应用的覆盖。所以,我们正在做一些......围绕灵活性画一些线。我们说你不能再什么都做了。你要做这个和这个,还有这个。但是,有了这些,就有了高性能的可编程性。我认为这很有趣。

我知道我们稍后会触及这个问题,但是我认为有两件事可以真正帮助我们--就使FPGA的采用比现在更快--是像开放标准这样的东西。因此,我们是否可以有基于生态系统的标准,用于FPGA的对话和编程?这样,我们就不会再有供应商的锁定了。

然后另一个是开放源代码。那么,我们能否为FPGA做同样的事情,就像Linux内核和Linux操作系统为软件做的那样?我们能不能有一个社区可以查看代码,可以作为一个社区编辑代码,他们可以使它变得更好,对吗?我认为这两件事--我们稍后会触及它们,这一点超级重要。

杰夫

我想把那条线换成斯蒂芬......所以,那是100%正确的。而在硬件层面上,这也是存在的。所以,你知道,现场可编程门阵列本身并没有什么作用。有逻辑元素,然后有主机接口、内存接口、网络接口,BittWare提供了很多例子和外壳。

将这些框架和基础平台抽象化的举措之一是--英特尔一直在推动开放框架堆栈--所以BittWare根据开放框架堆栈规范编写代码,我们在FPGA中实例化并实现PCIe上的主机接口逻辑、网络接口、存储器接口,并建立硬件,以便当你打开它时,FPGA可以移动数据。

现在,你知道,人们使用的另一种模式是有一个果冻甜甜圈,现在你知道,应用程序开发人员把果冻放进去,英特尔有专门的工具,现在他们称之为oneAPI,(就像斯蒂芬他们可能不喜欢我用称呼他们为果冻甜甜圈填充者)...一个API可以在他们的CPU、GPU和FPGA上工作,如果你在硬件层下面有这个OFS构建。因此,现在你可以用英特尔的高级语言编码,称为oneAPI,并让应用程序运行在配备了这个开放框架堆栈的FPGA硬件平台上(开放FPGA堆栈,实际上,我认为是它的代表)。

尼科勒特

你知道,你们已经触及了......这一个问题中的很多内容。但是,我真正想知道的是,我想我们已经触及了其中的一些问题,你知道(我们有一些来自观众的问题),但我只想首先解决这个问题:你知道,除了我们到目前为止提到的,在我们有点深入讨论之前,在FPGA中是否有任何新的发展,我们现在应该讨论,因为有一些问题是相关的?

谢普

是的,我想马上跳出来,因为有...有。我的意思是,FPGA长期以来一直处于工艺技术的前沿。但现在多年来--三、四或五年来--我们一直与第三代PCIe相处,似乎在过去的两年里,我们已经跳到了第四代,第五代--第六代就在眼前--CXL(与这些技术相互依存)就在其中。

从AMD/Xilinx、英特尔和其他所有的FPGA供应商那里,我们看到SerDes技术当然足够成熟,可以处理Gen4,就在交付Gen5的边缘(他们的Gen5设备,也是由主要供应商提供的)。因此,我想说,从Atomic Rules的角度来看,在与我们的客户交谈中,真正突出的一件事是在过去一两年中,Gen4和Gen5的爆炸性增长,CXL就在其背后。

当然,不用说也知道,如果没有底层的SerDes技术的支持,就不可能发生这种情况。但我的简短回答(我真的向我的同事们道歉......我必须在它前面,因为它已经大大改变了我们的业务)是第四代和第五代今天就在这里。

史蒂芬

是的,我想今天的网络研讨会的标题是驯服数据洪水。更高的速度和馈电是必要的......就像其中的一个关键部分。你不能让大量的数据进出FPGA,无论是PCIe、CXL还是以太网,那么不管FPGA做什么,它都无法跟上,对吗?所以,速度和馈电就像一个必要的构件。

但我将采取一个稍微不同的角度。我认为让我对FPGA和一般的SoC市场真正感到兴奋的事情之一:有两件事。其一是现在有能力从ARM等公司购买非常有能力的应用处理器,一些FPGA正在这样做。所以,你知道,人们...你可以在FPGA上启动Linux,对吗?...并把它基本上变成一个小型服务器,几乎像一个小树莓派。但现在你也有了灵活性,因为FPGA,除了有加固的ARM处理器内核,也有这种灵活的逻辑。这使你可以做一些相当惊人的事情。比如想象一下树莓派,你可以改变Linux与之对话的硬件......你可以编写驱动程序......这很有趣,你可以做一些非常惊人的事情。因此,这是一个方面--将Linux带到FPGA上,并允许软件开发人员与硬件对话的能力......硬件团队正在组建。

另一件真正让我兴奋的事情是小芯片技术。所以,你知道,英特尔FPGA团队已经在芯片基础上工作。AMD公司在其服务器处理器中非常经典地以小芯片著称,所以我们可以期待看到这一点。在封装内混合和匹配不同组件的能力,以允许,你知道,更广泛的SKU的味道,我认为是非常有趣的。因此,如果我有一个应用程序,我不需要以太网--也许以太网是在一个芯片上,所以我不需要那个芯片,这只是一个包装选项。如果我想要ARM处理器,它们可以在芯片组上,而且这些芯片组可以存在于不同的工艺节点上,从而降低成本。

我们甚至可以考虑将芯片用于高带宽内存连接等事情。所以,这几乎就像......我几乎可以看到在不远的将来,我可以去一个网站,点击 "我想把这些小芯片打包送到我的办公室",我可以选择我想要的东西,谢普可以选择他想要的东西,杰夫可以打包--你知道他们都会兼容足迹--所以杰夫可以把任何一个放在卡上,我们基本上可以得到更多的可变性,而不会增加成本,我认为这非常令人兴奋。

杰夫

是的,英特尔的土地,当然,他们把芯片称为 "瓦片",使用他们的EMIB互连--他们已经在这方面做了大量的工作。正如你所说的,以太网和速度已经大幅提高,就像Shep推出的PCIe一样,你知道,与此相关的是,他们正在提高以太网的速度,你知道,高达100千兆和NRZ...100千兆,对不起,PAM4速度--所以,最大可以绑定400千兆。现在这甚至不是一个大问题。

然后在存储器方面也是如此:外部存储器接口,DDR5,然后,正如Steven提到的,内部高带宽存储器瓦。因此,你可以添加,你知道,在一些即将推出的新FPGA上,得到32GB的封装内存储器,以非常高速的本地总线连接到FPGA上。

正在发生的另一个挑战(一个值得注意的新发展)是,随着这些速度和馈电,正如我们所说的,在外部芯片上继续增加,在移动所有这些数据方面变得严重限制......人们将他们的总线并行化,时钟速率正在上升,但在供应商社区半导体层面,每个人似乎都在采取另一个非线性步骤,即增加片上网络,在更高的带宽上移动数据。

这有两件事:它允许你在外设之间移动,也允许你在你的逻辑元素中移动它们。随着这些逻辑阵列变得越来越大(有数百万乃至数千万个逻辑元素),将你的数据移到那里进行处理是很难的,但现在将同样的带宽从第一个数据包处理器移到后处理器......你必须在这个大阵列中一路移动,这就是NOCs可以进来的另一个地方(片上网络:他们称之为NOCs...N-O-C)。

谢普

如果我们要讨论NOC,我想先说一下--也许我们稍后会回到这个话题......因为NOC是一个很大的话题--至少不是因为围绕它们的营销,不同的FPGA制造商正在使用关于加固的NOC。我只是想......我不想让它过去,在Atomic Rules,当然还有其他地方,我们真的受到了过去20年对Jan Gray和Nachiket Kapre开发的Hoplite网络的研究的启发。你可以在谷歌上查找Hoplite和围绕它的所有工作。这是一个非常好的平台,以软性方式研究NOC及其好处(和成本),我们在自己的软性NOC中得到了启发,我们在没有适合我们需求的硬化NOC的地方使用这些NOC进行数据分发。

就像我之前谈到的平台一样,NOC--硬的和软的--可以作为该平台的层,建立你的抽象。杰夫说,"我如何将数据从我的以太网侧转移到我的PCI侧,转移到我的内存,转移到我的存储侧?"绝对是这样。我认为这只是另一种类型的抽象,它可以被包装和捆绑起来作为一种好处,以减少复杂性,并从本质上隐藏一些你不想知道的东西,以便获得真正有价值的应用级细节。

尼科勒特

你知道,我们有一个来自观众的问题,关于NOC和具体的硬化NOC。我只是想提出这个问题。你可能已经在那里解决了这个问题,但也许我们可以在这里补上。一位观众问:"不同的加固外设和内部逻辑门之间的加固NOC如何影响内部数据路径的快速性,而FPGA在过去20年中缺乏这种快速性?"

杰夫

是的,这是一个详细的硬件问题,它是一个问题。你知道,我们一直......我曾非正式地使用过这样一个术语,你知道,所有这些疯狂的东西--把所有这些数据移来移去--有点像管道工程。如果你想让你的水进入房子,那是一回事。如果你想让水进入厨房的水槽和浴室,你知道,你必须把它铺设起来。而......这个比喻真的适用于FPGA。然后,如果你想有,你知道,一点点水从你的厨房出来,那是一回事。但是,如果你需要在你的厨房里有一条消防水管,你需要一个不同的管道结构,对吗?

这就是硬件NOCs的作用,也是所有供应商现在正在与之斗争的地方。正如Shep所说,他们在不同程度上在外围设备之间建立了网络,只是,你知道,从以太网转移到PCIe,然后以不同方式将其纳入结构。正如我所提到的,如果你有一个400G的以太网进入一个加固的MAC FEC......现在它的输出,你需要在你的逻辑中做一些数据包处理......好吧,这是连接。现在,该逻辑的输出,你如何把它移到某个地方?

所以现在你需要一个能在结构中访问的NOC,他们有这些网络访问端口。一些供应商正在积极地加入这些端口,一些供应商正在计划在下一代中加入这些端口。每个人都在朝这个方向发展。当然,像任何这些技术一样,即使在营销幻灯片上,它们看起来像仙尘,但细节中总是有魔鬼。它们不能解决所有的问题,而且还有一些其他的问题,其中之一是你开始在巨大的带宽和总线宽度上以千兆赫兹的速度切换东西......事情变得很热。

NOC倾向于增加热耗散,因为你翻转的位子越多,东西就越热。而且它们走得越远,它们的电容性负载就越大。但它们是一个伟大的工具,现在正被社区利用,并且随后将出现在所有硬件上,我想。

史蒂芬

而且,那种只是补充,你知道我喜欢的短语是 "从消防水龙头喝水"。所以,你知道,我们考虑到这些令人难以置信的数据洪水速度和供给。如果你想看每一个数据包或每一个从主机上传来的比特,你最好能够消费它们,对吗?否则,你就会从字面上喝水,那就不会有好结果。

因此,我们必须确保我们可以在设备内移动这些数据,你知道的。我认为,杰夫关于热的观点--比如东西发热--是一个非常好的观点。因此,我喜欢我们与杰夫的公司合作的一个重要原因是,你知道,他的公司非常善于考虑像热这样的事情。

杰夫提出来的事实提醒了我,这很重要。你知道,在我的过去,我曾对FPGA进行编程,但它没有得到冷却,就像没有风扇吹过一样......我把那该死的东西吹起来了我承认......也许我不应该这样做(笑声)!但是,如果这些东西变得如此之热,那么我就必须承认! 但是,如果这些东西在努力工作时变得如此之热,所以它坐在那里无所事事--那么它很高兴。然后我让它做......很多事,突然它变得非常非常热,非常非常快。而杰夫,你知道,杰夫的公司想到了这一点。

杰夫

不过,你有没有把它弄得足够热,以至于它的焊点回流并真正从电路板上掉下来?

史蒂芬

我还没有这样做。

杰夫

这时你就会知道你已经有了一些进展!"!

布赖恩

那是相当热的,伙计们,那是相当热的。

史蒂芬

因此,BittWare公司和Molex公司对事情的处理很好。这就是他们带来的经验,"我们如何保持这些东西的冷却,使他们不知道他们不会死?"是的,这真的很重要。

布赖恩

好了,我们已经谈了很多关于数据的问题,对吗?让我们深入探讨一下。我们在数字领域谈了很多......让我们也来谈一谈传感器内的数据洪流,对吗?FPGA是如何帮助模拟世界的。杰夫,这可能是一个硬件问题。

杰夫

是的,还有一个也是超级深的。所以,这有两个快速的答案。

一个是大多数......BittWare过去做了很多模拟接口板,并将它们转移到信号处理资源......主要是FPGA。

现在有了标准化,所以我们不再那样做了。一般来说,当人们在发射器中转换模拟信号,或从数字到模拟时,他们在无线电头或传感器头的某个地方进行转换。然后,他们将其数字化,并将其打包,然后将其转移。

因此,我们现在大多数做传感器接口和处理实现的应用--无论是JESD或VITA49,还是新出现的DIFI射频标准--我们都与一些标准的数据包协议相连接,如以太网,只是在移动数据。

另一种方法是(你知道,我们正在谈论--Stephen正在谈论--关于芯片和瓷砖),各种供应商现在正在增加模拟到数字转换器和数字到模拟转换器,作为Stephen可以......订购你知道的这种颜色和这种功能的那些复选框选项。你可以得到带ADC或不带ADC的产品,而且你可以直接进行模拟接口。

我们有--BittWare有--硬件,可以直接将5GHz的射频输入,并将其数字化......有强化的下变频器、上变频器,然后将其移入FPGA结构进行后处理。因此,这是正在发生的方式之一。

尼科勒特

你知道,我们有很多来自观众的问题。我现在就来回答其中一个问题。让我们看看......你能从成本角度谈谈FPGA在边缘计算领域的可行性吗?FPGA是否更适合于设备边缘或企业内部的边缘?

杰夫

嗯,成本是像带宽和性能一样的东西......你知道,这都是相对的,你知道吗?当Stephen谈到Raspberry Pi的时候,我有点害怕,因为那是一个稍微不同的价格点。而FPGA,一般来说,并不便宜。

你知道,我们的销售人员,我肯定他们--如果他们在听--现在正在向我投掷飞镖。但本质上......另一件事是我前几天听到有人称它为--FPGA是现场可编程门阵列,但另一个术语是灵活的、相当好的ASIC,对吗?我喜欢这种方法和这个术语。ASIC的开发成本很高,一旦开发出来,部署起来就很便宜,对吗?

FPGA以不同的方式来做这件事。开发仍然很困难,但它远没有ASIC开发那么昂贵。但是设备本身的经常性成本要高得多。当你想开始有印刷电路板、电源和热限制时,它们可能是相当昂贵的解决方案。他们......当你得到一个足够大的东西,价格占主导地位时,人们就会选择ASIC,这只是一种更便宜的部署方式,市场已经证明了这一点。

因此,FPGA在做一些你无法以更高的成本效益做的事情方面相当出色。在这个意义上,FPGA可以是超级便宜的,因为不管硬件有多贵(以及来自我们合作伙伴的IP),如果你不能以任何其他方式来解决这个问题,而且你为你的市场增加了巨大的价值,并扩大了你的可用市场--这是一个非常有效的资金花费。但成本通常不是我们获胜的原因。

谢普

但是Jeff,FPGA还有其他的方式可以带来价值。我同意你刚才所说的,但我必须跳出来指出,尽管FPGA增加了成本--尽管它们增加了复杂性和集成的挑战--FPGA经常被用来卸载可能需要AMD和英特尔的昂贵的重型内核来完成同样的工作的操作。

而净收益......尽管许多应用程序不会去想 "我的工作是减少使用的核心数量"。通常是:工作是为了解决一个特定的计算问题。但在这一过程中,他们最终意识到一个支持FPGA的解决方案(也许是因为在数据从网络到内存再到存储的过程中的一些巧妙之处)必须减少旅行,并且需要更少的昂贵的重金属,就像它一样,特别是在数据中心或内部情况下,而不是在对电源更敏感的现场情况下......在 "嗯,我需要更少的主机处理器来完成它 "方面的成本节约......是经常性的节约,可以用来资助昂贵的FPGA开发和昂贵的电路板......

杰夫

这是一个总成本的问题,我认为斯蒂芬在计算存储方面的应用与此特别相关,你知道,计算存储解决方案,我不认为有人会认为是便宜的,但比替代方案更便宜。

布赖恩

我的意思是......让我们谈一谈计算存储......我还想谈一谈移动数据,对吗?你知道,从你的人的角度来看--无论是Shep还是Stephen。

所以,我不知道你们是否想先谈计算存储,然后我们可以回去,或者先移动数据?

史蒂芬

是的,我将跳到计算存储上。所以,计算存储--正在发生的事情是,你知道,世界正在产生的数据量,它只是呈指数级增长,对。我认为企业已经意识到的另一件事是,除非你能分析它并从数据中开发出商业智能和聪明的商业决策,否则这些数据是无用的,对吗?

储存数据,你知道,没有那么多的意义。现在,从这些数据中获得洞察力是关键。公司想要快速地做到这一点,他们想要有效地做到这一点。因此,他们注意到的是,与其把一大堆数据像谢普所提到的那样放回英特尔或AMD的CPU核心并运行软件,不如把你的查询推到存储层,实际上让存储层运行这些任务。无论是数据库查询,还是在一堆传感器数据上的人工智能推理,无论是像,你知道的,分析数据库的某种业务指标。

因此,标准化正在发生在我们称之为计算存储的领域。因此,我们不是只有存储数据的盒子或设备,而是如何有能力将计算查询推到这些盒子上,不管它是一个驱动器,不管它是一个固态硬盘,还是一个装满它们的盒子--类似于NAS,对吗?因此,围绕这个问题正在制定标准,而FPGA可以发挥很大的作用,因为就像Shep所提到的,有一些任务用FPGA这样的东西来完成会更有效,更有成本效益。

但是你也希望有时间上的变化。如果查询发生变化,你可能希望功能发生变化,而这正是FPGA真正发光的地方:在 "A "时间有某种特性的能力,但也许在一天的不同时间,你的工作负荷发生变化,你实际上希望处理能力改变其特性。这在ASIC上很难做到,但在FPGA上却非常容易做到。

你知道,计算存储......也涉及标准。就像我之前提到的,标准(在我看来)推动了市场的采用,从而推低了价格。这一直是个好办法,对吗?因此,购买一块FPGA可能会花费很多。如果你进来并要求购买50万颗,你可能会得到一个更好的单位价格。

杰夫

是的,还有一点,关于......就像FPGA的其他东西一样:有广泛的能力,你可以在Raspberry Pi领域购买FPGA,从定价上看,但其中一些,你知道,单个芯片超过10,000美元(在极端情况下),BittWare同样有广泛的动态选择范围。

因此,在斯蒂芬的计算存储应用中,当人们正在部署大量的计算存储加速器时,我们可以出售东西,你知道,在我们知道用例是什么的有限应用中,我们可以出售一千美元或更少。而我们还有其他的400G的东西--那些东西的解决方案接近几千美元。

而我们即将推出的东西,在这些HBM和所有这些方面会更多。因此,有一个广泛的成本范围。但是,当我们在研究边缘和物联网部署时,这取决于你认为 "很多 "意味着什么。

布赖恩

那么,Shep,你想谈一下移动数据的问题吗?

谢普

当然,(笑)。

尼科勒特

如果我们谈论的是移动数据,我们可以在这里待上一段时间,对吗?(笑)大家系好安全带!

布赖恩

我们有25分钟;我们很好,我们很好。

谢普

所以,谢谢你的问题。其中......我想说Atomic Rules的主要IP产品是一个名为Arkville的产品。Arkville是Atomic Rules基于DPDK的数据移动器的品牌。它是一个IP核,可以相对容易地将大量数据从FPGA转移到主机存储器,或以另一种方式转移,而不需要深入到我所说的基于平台的设计的较低层次,这对于同时实现高吞吐量和相对低延迟是必不可少的。

从系统结构的角度来看,数据运动的整个概念其实很简单,对吗?例如,我在FPGA中得到了数据部分 "A",想把数据送到主机存储器中的 "B "处。软件工程师可能想调用memcpy或者,你知道,移动数据并使之发生。

对我们的客户来说,我们的目标是使这种体验尽可能地接近他们所寻找的东西。数据从FPGA硬件进入用户地主机内存--不问问题/问题。

是的,它比这复杂得多,但这就是我们的客户所购买的。他们认识到,为了完成这个描述起来非常简单的任务,在它下面有硬件设计、软件设计、API设计、驱动设计、FPGA时序闭合--所有这些部分,在很大程度上,Atomic Rules提供了一个完整的解决方案,如果事实上,从FPGA到看起来像主机内存的数据运动对你很重要的话,那就有很大的价值。

史蒂芬

是的,也许只是跳进去补充一下。所以Shep提到了DPDK,它是网络领域的一个主机软件栈,旨在将流量从主机内存转移到网络上或从内存转移到内存。我更多地在存储领域工作,讽刺的是,存储也都是关于数据移动的。磁盘上有数据,你想把它弄到内存中,因为你想处理它,或者你在内存中有数据,你想弄到磁盘上,你想保持它的安全,因为它就像你爱的猫的照片,你爱你的猫......

因此,有相当多的存储标准也与数据移动相关。因此,我们做的事情和Shep完全一样。我们在FPGA的硬件上创建这些数据移动器,但我们必须向主机和客户提供API。我们使用以存储为中心的,而Shep使用以网络为中心的。

所以对我们来说,就是像NVMe(NVM Express)这样的东西,今天你的笔记本电脑或游戏电脑中的很多固态硬盘都有NVMe驱动器。另一个是SDXI,这是一个新的标准,专门用于数据移动。因此,这些允许我们(作为我所说的软件供应商)在FPGA上与主机端公认的堆栈(在Shep的案例中是DPDK,在我的案例中更像是......像NVM Express或SDXI)集成。

尼科勒特

好了,伙计们,所以我想谈一谈CXL。所以,当我们昨天聊天时,你知道,杰夫,你提到这是最近相当热门的词汇。我认为我们应该提到这一点......谈谈CXL在董事会的议程上有什么,然后也许在史蒂文和谢泼之后,你可以分享一下你对这种东西的想象力会怎样。

谢普

好的,杰夫?

杰夫

CXL是......确实引起了所有人的注意。再说一遍,我认为在高水平上的承诺,如果你读了所有的媒体,你知道,有神奇的仙尘让每个人的问题都消失了。但事实并非如此,但它确实是抽象的(它是Compute Express Link),它允许抽象和互连IO/缓存/内存到一个单一的连贯的领域,任何人都可以看到任何人的信息和数据。

而且有各种方式正在实施。其中一件事是--虽然我确实认为它肯定会改变我们的行业,并极大地影响人们如何架构和部署解决方案--但在我看来,还没有完全清楚如何实现。我不认为许多人已经说:"啊!我知道了,我现在知道如何做一切了。"它开辟了全新的维度和能力,人们以前没有能力去思考。我认为会有一些配合和开始,人们会尝试,"哦,让我们这样连接它。哦,等等,这不是很好的工作。你知道,也许有一个更好的方法来做它。"

另一件事是,从技术上讲,这已经是早期的事情了。因此,我们将在今年年底推向市场的FPGA将支持CXL 1.1。将会有......2将在以后推出,我想,在2023年。然后,3.0已经被记录下来,计划并发布,这将是2024年的时间框架。因此,在硬件层面,将有一个演变,以及一个演变,你知道,人们在如何使用CXL构建系统方面变得更加聪明。

史蒂芬

是的,如果我只是跳进去,我的意思是......所以CXL,对于那些不知道的人来说,是一个通过与PCIe相同的线路运行的协议。因此,如果你看看你的笔记本电脑或你的游戏机或你的游戏PC--任何你可以插入PCIe设备的地方--理论上,从现在起的几年内,你可以插入一个CXL设备。

现在,下一个问题是 "我为什么要这样做?"嗯,PCIe在数据移动方面有一些限制。最大的一个限制是它不是我们所说的缓存一致性。因此,当你将数据移动到显卡和一些......或通过PCIe移动到网卡时,你必须要有点小心。而我们的操作系统为我们解决了这个问题。

有了CXL,它实际上是一个连贯的协议。因此,它允许我们做一些我们不能用PCIe做的事情。现在,我们仍然能够用PCIe做很多事情,我们用PCIe做了很多事情。但是,像杰夫提到的那样,CXL开启了一些新的模式。

而且,就像他说的,我们还不太确定我们要做什么。但是,根据我在业界看到的情况,很多大型云计算公司要做的第一件事就是内存分解。他们实际上将把一些内存从处理器上的DDR通道移到CXL卡上,甚至为像超大规模的人(如谷歌)提供一个CXL的架子。

现在我的看法是,如果你要这样做,那么也许你可以开始把一些计算服务放在内存上操作,就像我们做计算存储一样。所以,我们可以把计算推到内存上吗?而且,为了做到这一点,我们可能需要一些灵活的算法--所以FPGA开始与我产生共鸣。所以,我认为这是一个FPGA有很大潜力的领域。

我认为需要注意的另一点是:我们并不真正知道它将如何发展,所以我们将需要灵活性。因此,我认为FPGA有一个机会,特别是在早期,因为我们不是100%确定我们要做什么。因此,我们不会花费5000万美元去开发一个ASIC。我们将尝试使用FPGA。我们可能会以合理的数量部署它们。我......不幸的是,你知道,如果应用足够大,有人会说,好吧,我打算在这上面旋转一个ASIC。

但我认为有一个灵活性的机会,因为工作量确实在转移,我对这种潜力感到非常兴奋。

谢普

所以,斯蒂芬,我有......我想我们许多一直在关注CXL的人都听说,内存分解将是CXL的 "Aha!"时刻。但是,我很难理解分解内存对这些内存加载和存储到实际使用它的客户端的延时意味着什么。

我想这是CXL必须迎接的挑战,因为,你知道,你今天在当代主机处理器上说的是几十纳秒,而在CXL现在寻求的那种SerDes上则是数百纳秒。因此,我个人......我不想打赌,但我认为这不会马上发生。

就我们而言,在Atomic Rules,我们正在做的是立即追赶CXL......英特尔已经积极地推出了他们的I系列Agilex设备......我们之前谈到了芯片和瓦片......相应的R瓦片(我们今天使用它作为Gen5 Arkville的一部分......将在Arkville 22.07)--我们没有CXL,我想说清楚--但是那个支持PCI Express第五代的R-tile......我们采用了英特尔的CXL和PCI并排使用的能力,我们采用了......今天我们的客户中很少有人需要第五代x16的全部火力输出。他们中的一些人当然希望如此,而且我们肯定会为他们服务。但我们只能说,你知道,百兆以太网或多个百兆以太网或百兆管道在今天比400兆更受欢迎。

我们已经采取了这些100千兆和400千兆的数据流,并将它们分开,因此今天在英特尔的I系列R-tile上,我们可以让Arkville与gen5 x8端点一起工作(一半的可用带宽),并将R-tile通道的另一半用于CXL。明确地说,Atomic Rules目前没有......没有提供支持CXL的能力。

我们正像其他人一样密切关注它,我们认为这需要一些学习。但是......我们在这个方向上的小动作是不采取任何会抑制CXL采用的行动,例如,"嗯,你知道,如果你想使用原子规则,那么你就要走PCI的道路,你不能用它来做CXL。"我们与此恰恰相反。如果你想让CXL与你的PCI混合,你可以同时拥有它们。

布赖恩

因此,这里有另一个观众问题:"你是否预见到更高的光学I/O,如与FPGA共同包装的光学器件,对智能网卡的要求越来越高,超过了可编程可插拔接收器的要求?"我想这就是他们的问题。收发器对不起。

杰夫

答案是,是的,我希望他们现在就在那里。我讲的一个小轶事是,当我在八十年代开始我的职业生涯时,我和一些人一起工作,他们在谈论,你知道,这些背板中所有这些铜的东西都是旧闻。我们将在未来几年内转向光背板和光互连(注意,这是在八十年代)。当然,这些都没有成为现实。

现在Molex在这方面做了很多工作--这不是我的专业领域,我不熟悉我们在那里做的事情--但肯定有一种愿望和行动,因为我们的信号传递速度越来越快,要把这些东西从芯片上拿到封装中,从封装到PCB到连接器,更加有效。

而做到这一点的最终方法在某种程度上将必须是光子学。这有两个层次。一种是通过铜连接芯片和封装中的光学引擎,你将光学器件插入封装中。人们正在讨论和研究的另一种方式是将光学引擎集成到硅中。你只是在你的芯片上有一个激光......射出,那就更远了。我对此了解不多,但我希望它是真的......但我不指望它很快就会出现。

史蒂芬

是的,我认为这是小芯片技术的另一个机会。这也是为什么像UCIe这样的事情让我感到兴奋,因为你知道,硅光子学和诸如此类的东西往往需要一个完全不同的制造工艺,而不是FPGA灵活逻辑所需要的......这也与ARM内核所需要的不同......这也与模拟收发器所需要的不同。

因此,芯片技术:我们实际上可以挑选不同的工艺,甚至有可能挑选非硅基半导体(如果它有意义的话),这在硅光子学中经常发生。但我同意杰夫的观点。我确信杰夫的客户希望今天有最快的速度和馈电--这需要光学,特别是芯片外的光学--我们还没有达到这个水平,但我们需要达到这个水平,因为数据洪流在继续增长。

谢普

是的,但是......光子学有它的位置,如果我们要以这种方式展望未来,它肯定是你必须要去的地方。我个人认为,我们正处在一个时代,在我们举起双手说我们已经完成了模拟技术之前,我们可以收获过去几十年来在SerDes技术方面取得的巨大、真正巨大的进展。在这一点上,我们刚刚进入PAM4信令。而且,你知道...我们知道我们看到了道路的尽头。

但是,有很多机会可以降低功率,减少复杂性,使这些子系统对诸如gen5 PCIe和CXL的工作至关重要......更容易工作,价格合理--不需要10000美元的FPGA来承载该基底。我认为,市场可能会找到机会,让今天无聊的老式......32G的SerDes找到一种降低成本的方法,并将其放入更便宜的FPGA,产生看起来更像今天的解决方案的解决方案,但功率更低,成本更低。

尼科勒特

好吧,让我们来看看这个问题。"需要什么样的技能来把裸露的FPGA变成解决特定问题的东西?我怎样才能利用你的工作来使我的FPGA部署更加成功?所以我......Stephen,也许你可以接受这个问题?我想我们可以在这里谈一谈合作关系,这可能是一个好机会。

史蒂芬

是的,我的意思是,我认为,你知道,有几件不同的事情。你知道,首先,对于那些正在听这个网络研讨会的人来说,"我想玩,我想和FPGA一起工作"。我要说的是,在学习如何使用FPGA的工具和基于学术的平台方面,已经有了惊人的发展。

现在有一个很大的推动力,使更多的FPGA流程开放源代码--供应商中立。有一些很好的程序,如果你在谷歌上搜索,可以做到这一点。还有一些惊人的在线学习。所以,如果你想学习--如果你想成为一个极客,你知道--那里有非常好的东西,值得你去挖掘并开始玩。你可以买一块便宜的板子......你可以把它连接到你的笔记本电脑或桌面上。你可以上网,有YouTube视频,有免费课程,你可以直接开始玩这些东西,这是一个非常好的开始。

现在,如果你对部署FPGA以解决你的业务的特定问题更感兴趣,如果你不想自己做,这就是你来找像Shep和我这样的人,用软件来提高抽象水平,这样你的工程师就不必谈论FPGA语言。低级别的FPGA语言是像Verilog和VHDL以及SystemVerilog-它们是,你知道,它们是计算机编程代码,但它不是C语言,也不是Python。它的水平要低得多。

而且,你知道,我们公司内部有在使用这些语言方面非常有经验的团队,但这不仅仅是使用这些语言的工作。从架构师的角度来看,它是对这些东西如何被构建的理解?

我总是把FPGA想成是,当它刚被打开时,它几乎就像一个建筑工地。你拥有所有这些资源,如木材和,你知道,水泥和任何东西。而杰夫的...

杰夫

不要忘记我的水管!

史蒂芬

...杰夫的公司提供所有这些。所以你转身......我的公司转身到建筑工地,然后说:"好吧,我们有一坨(原谅我的语言)一坨材料。我们今天要建什么?"对吗?我认为自己是我们公司的建筑师。所以,我进来后,我看了看资源,我看了看客户想要什么,然后我想,好吧,他们想要一个......他们想要一个摩天大楼。好的。所以,它将会开始看起来像这样。

而且我会在高层做一些事情,我们需要这个区块。我们需要这个区块。然后团队进来,他们更像是......你知道,建筑团队。我们在这个团队里有专家。因此,我们有相当于电工、水管工和脚手架人员。

因此,他们开始一起建造这个。到最后,我们实际上在FPGA的场地上建了一栋楼,我很抱歉这个比喻效果很差,但是(笑声)这是我认为的一种方式。所以,你需要多种技能,对吗?你需要一个建筑师......你需要建筑工人、项目经理、电工和水管工。

而这些人往往是,你知道,有多年经验的研究生水平。我们有一大堆的工具,我们用它们来使它更容易。然后,最终,它使部署更容易的方式是我们提高了抽象水平,我们提出了一个API--不管是Shep的API还是我们的API,还是基于标准的API,如英特尔的oneAPI--给客户,因为它使他们的生活更容易。

布赖恩

现在,我知道当我们前几天讨论时,我们正在谈论Arkville作为数据搬运工的问题。你能解释一下数据传输者和DMA引擎之间的区别吗?

谢普

当然,我们经常收到这个问题。DMA引擎起源于在计算机上进行数据复制的实际硬件,可以追溯到早期的计算机架构:少量的计数器、源地址、目标地址......软件用计数来启动它,数据从一个地方移到另一个地方。这几乎概括了大多数硬件、软件和系统工程师对DMA引擎的看法。

但是Arkville作为数据运动的解决方案--从FPGA到主机内存或其他方式--不仅包括内存缓冲区的低级运动,显然,由于内存在FPGA上或内存在主机中,它们是抽象的,也许它们是流,也许它们是消息。我们想呈现一个像DMA那样简单的接口:"哦,源头在这里,目的地在这里,计算一下就走!"...但是,在这个更高的层次上。

对硬件工程师来说,这意味着标准的行业API,用于将数据输入和输出到模块中。在软件方面,它意味着一个标准的内存虚拟指针,所以你可以生产它,也可以消费它。

例如,在FPGA中产生数据和在主机中消费数据这两个动作之间发生了什么,或者反过来?我们不会说我们的客户不关心那里发生了什么,但他们希望为他们做这些。他们想知道运动是如何编排的,如何进行的。它需要是高性能的,在这个意义上,它有这样那样的吞吐量,它必须有这样的延迟,这提供的价值是它是另一个平台。数据运动平台是为他们提供的,他们可以继续使用他们的应用程序。

当然,如果你的需求很专业,而我们提供的模式并不合适,正如Stephen刚才说的,"这是一个FPGA,去做你需要的任何事情;你有这个能力"。

我们利用了我们在AXI接口中看到的一系列标准,例如在硬件方面,或者DPDK作为一个标准的Linux基金会软件API,并取得了成功,因为有足够多的人发现,"嘿,我不想自己做这个。我可以从Atomic Rules购买,或者我可以从BittWare/Molex获得那个板子,这对我们来说很有效。

尼科勒特

所以,我们还剩下大约4分钟,我在想,在我们结束之前,我们是否可以谈一谈最后一件事。如果我们还没有谈到你的问题,不要担心,BittWare和团队会有你的问题,这样他们就可以在活动后解决这些问题。

但我想快速地谈谈开源问题,以及它和开放标准对采用基于FPGA的解决方案的重要性。因此,也许有任何超级重要的标准,斯蒂芬,也许你可以接受这个问题?

史蒂芬

当然,是的。我的意思是,在计算存储领域,我们正在对我们称之为NVMe(NVM Express)的命令集进行标准化--希望你们大多数人都听说过,现在你们的大多数笔记本电脑中都可能有这个命令集,以谈论计算和存储。因此,如果我们想要一个可以将计算任务下放到FPGA的API,我们将能够利用这个非常开放的标准。

这样做的好处是:我不再需要让我的团队在Linux或Windows中编写驱动程序;NVMe驱动器已经存在。我知道,今天出厂的每一台服务器,今天出厂的每一台台式机,都支持NVMe,因为这就是我们启动操作系统、加载游戏和其他东西的固态驱动器的动力。

因此,这使我的生活变得更加轻松,而且还创造了一个生态系统,因为它不再只是Eideticom公司的事。任何人都可以在这个NVMe计算存储空间中发挥作用。因此,这创造了竞争,你知道,这不一定是一件好事,但我实际上认为这是一件好事。对我来说更重要的是,它创造了一个生态系统,而生态系统推动了采用。采用推动了价格下降,从而增加了采用,你会得到这种良性循环。

所以,我非常相信开源和开放标准。我们在诸如Linux内核和SPDK等方面做了大量工作,SPDK相当于Shep先前所说的存储(DPDK)。

同样,我认为在一个社区内有这种合作真的很重要,有许多不同的公司在看代码,"我们如何使它更好?我们如何使它更安全?我们如何使它更有效率?"

同样,我认为这只会导致更好的采用。我喜欢这样。

谢普

斯蒂芬刚才说的一切--那是非常棒的--但我还想补充一点:以这样一种方式回馈社区,使代码得到审查并成为可信赖的。当然,没有人想要一个专有的解决方案,所以在GitHub上放一些可以使用的东西是很有意思的。

但你知道什么更有价值吗?让你的代码被Linux基金会和他们的各种团体审查,这样你的开源部分就被整个社区所信任和审查了。我知道Eideticom和Atomic Rules也是这样做的,这个过程对所有这些都是至关重要的,因为当信任圈包括行业内的巨头时,这些开放源代码的价值就会被放大。

布赖恩

好了,各位,我们的时间就要结束了。我希望我们有......我们有这么多伟大的问题在这里。各位,感谢你们参加我们今天的现场聊天。感谢我们的赞助商,Mouser Electronics、BittWare和Molex。也感谢我们了不起的小组成员加入我们。

尼科勒特

是的,非常感谢你。

布赖恩

祝大家有一个愉快的一天。