小組討論

從COTS的角度進行數據採集和記錄

在下面免費觀看錄像!

硬體中對 200 Gb/s 和更高速度的數據捕獲和記錄的需求越來越大。許多選項傾向於專有,但有沒有辦法使用商用現成 (COTS) 元件?我們將與IP供應商Atomic Rules、COTS FPGA卡供應商BittWare和系統供應商One Stop Systems一起探索這些選項。

揚聲器

查德·漢密爾頓肖像
漢密爾頓 | BittWare產品副總裁
謝普·西格爾照片
謝潑德·西格爾 | 首席技術官, 原子規則
吉姆·伊森肖像
吉姆·伊森 | One Stop Systems 首席產品官

布萊恩

感謝您今天參加我們的會議。我是布萊恩·德盧卡(Bryan DeLuca)和妮可萊特·埃米諾(Nicolette Emmino),我們將擔任今天的現場聊天的主持人,從COTS的角度看數據採集和記錄,由貿澤電子和BittWare贊助。

我們有一些很棒的小組成員,這是一個即時聊天,所以請確保在螢幕底部的問答中提出問題。現在到尼科萊特。

尼科萊特

您好,就像 Bryan 說的,歡迎參加我們關於從 COTS 角度進行數據捕獲和記錄的小組討論。為了引導我們今天進行這次討論,BittWare產品副總裁Chad Hamilton、Atomic Rules首席技術官Shep Siegel和One Stop Systems首席產品官Jim Ison加入了我們的行列。

但是,在我們深入探討具體問題之前,我想給我們的每位小組成員一點時間介紹他們自己和他們的公司,因為這是三家截然不同的公司,它們聚集在一起提供了一個有凝聚力的解決方案。

那麼,乍得,你為什麼不把我們踢開呢?讓我們每個人都簡要概述貴公司的核心專業知識,特別是它與 COTS 和數據採集解決方案的關係。

乍得

當然,謝謝你邀請我。同樣,查德·漢密爾頓(Chad Hamilton)在公司工作了將近16年。BittWare實際上已經經營了大約34年。我們在計算、網路、存儲和感測器處理領域提供企業級 FPGA 硬體加速器,產品來自 Intel、AMD 和 Achronix 等高端 FPGA 公司。

我們擁有市場上規模最大、也許是最大的 COTS FPGA 產品群組之一,我們的客戶可以快速、經濟高效地開發和部署該應用。如果 COTS 不是客戶的解決方案,我們會在可能的情況下進行定製。我們會接受它,你知道,如果它有很好的商業意義,我們可以做任何事情,無論是我們現有產品的輕微變體,還是一個完整的定製解決方案。同樣,它必須對各方都有意義。

我們還擁有一系列用於開發和部署的TeraBox認證伺服器,並且與我們的合作夥伴(如One Stop)一起,我們可以提供完全集成的伺服器和卡解決方案。

最後,我們...我認為現在世界上每個人都在談論人工智慧和機器學習。因此,我們已經開始與一些基於FPGA和ASIC的公司合作,以覆蓋數據中心到邊緣。

尼科萊特

棒!謝普,你呢?

夏普

確定。大家好,我是Shep Siegel。我是 Atomic Rules 的首席技術官和創始人。我在 2008 年創辦了 Atomic Rules,當我們開始的時候,它是一家服務店,基本上僅自己一個人。多年來,我們引進了大約十幾位非常有才華的工程師,在2012年或2013年左右,除了提供IP設計服務外,我們還開始製造IP核。而且,事實證明,製造核心的業務最終將引導我們找到COTS和交鑰匙解決方案,就像我們今天談論的TK242一樣(稍後會詳細介紹)。

原子規則 DNA 是關於複雜併發的。我們解決具有許多活動部件的困難 RTL 問題。我們有我們的...我們有特定的工具和語言,可以很好地處理複雜的併發。我們卓越的產品 Arkville 是我們的 DMA 品牌,用於在主機記憶體和 FPGA 或 FPGA 和主機之間行動數據,是當今性能最高的 DMA 引擎......在 Gen 5 x16 PCI 等最新標準上...每秒 60 GB。這是我們的名片。

大多數人從他們的IP核中知道原子規則,特別是Arkville是......我們的DMA品牌。但是,正如我們今天將在電話會議中討論的那樣,我們一直在嘗試COTS領域的新事物。你問了關於COTS的問題,我們已經把我們的一些IP最熱門的東西組合成對數據包捕獲有用的東西。我希望我們能在這次電話會議中更多地討論這個問題。

尼科萊特

吉姆,你呢?

吉姆

是的,Jim Ison,One Stop Systems 的首席產品官。One Stop 已經存在了 25 年。我去過其中的 19 個,看到了一個很好的轉變......我們做堅固耐用的系統,直通邊緣。通常,我們處於數據中心類的元件中,我們可以非常快速地將其放在邊緣,在上市時間內獲得...像 GPU、FPGA 卡、NVME 驅動器這樣的東西,你習慣於在亞馬遜雲或你剛購買的桌面工作站中使用的所有東西。

但是我們能夠將其引入邊緣的加固系統,然後我們大規模地做到這一點。因此,我們也是PCI Express專家,例如,一台具有5個插槽的伺服器,我們可以將其擴展到16、32、128個插槽,因此您可以真正大規模地在邊緣部署非常高端的系統。

尼科萊特

好了,夥計們,非常感謝你們花點時間真正解釋每家公司都在做什麼。讓我們從頭開始。誰能給我們...我知道我們大多數人可能都知道這個問題的答案......但是,誰能給我們簡要概述一下商業現成(或COTS)在數據捕獲和記錄技術的背景下意味著什麼?有點......它與定製解決方案有何不同?誰願意去現場。乍得?

(吉姆)乍得,你靜音了。

(查德)不好意思。我說:“我為什麼不拿呢?

(妮可萊特)我說了任何人,但我真的是你,乍得。(笑聲)

(布萊恩)對,對。

乍得

因此,現成的商業產品是為公眾準備的現成產品,具有標準的、完善的外形尺寸,例如PCIe是我們今天正在做的很多卡。但我們過去做過U.2、VPX、Compact PCI。我的意思是,有各種各樣的標準和外形尺寸,人們知道他們可以去購買這些現成的產品,並將它們插入一個可以快速部署的系統中。

例如,他們不需要為這些類型的產品設計新的定製背板......與完全定製的解決方案相比--有人可能會來BittWare,要求我們提供一些不同格式的卡,也許它沒有相同的標準外形尺寸。你知道,這是一項更昂貴的投資,因為我們要為通常的一個客戶開發一張卡。就像我之前說的,如果商業案例有意義,這很好。

從數據採集和記錄的角度來看,我們正在用這些卡開發這些卡(讓我們暫時堅持使用PCIe,因為這又是我們現在市場上最流行的卡),我們將在那裡添加I / O。因此,例如,乙太網。我們可以在這些卡上執行 400 Gb 乙太網。例如,這些是標準的 QSFP 連接器。PCIe Gen 5 x16 是 COTS 外形尺寸。我們將在該卡上安裝外部記憶體和其他類型的介面,它允許像Atomic Rules這樣的公司繼續在市場上易於訪問的平臺上實現他們的設計。他可以接受這一點,並把這種解決方案所需的秘訣放在那裡。

布萊恩

那麼,COTS 元件的可用性如何影響新數據採集和記錄解決方案的創新和上市時間?

(謝普)我,我,我!

(布萊恩)好的,你去吧!(笑聲)這都是你的,謝普。

夏普

右。是的,所以一切都......我當然同意乍得對 COTS 所說的話,那裡的一切。

但你知道,COTS不僅僅是硬體、邊緣、系統和重鐵。這也與軟體有關。對我而言,COTS意味著購買而不是構建和快速獲得原型,而不是走漫長的開發之路。

我之前提到過 Atomic Rules 在 IP 核、DMA 引擎、數據包處理等方面的歷史。幾年前,我們開始聽到越來越多的鼓聲,需要數據包捕獲。我們看到了基於商戶 ASIC 的 NIC 在執行數據包捕獲方面的局限性:它們會丟棄數據包,它們的性能不符合數據包捕獲解決方案的要求。

我們開始聽到多個客戶說,「我們能不能把原子規則核心與OSS磁碟驅動器和BittWare板一起做一個解決方案?

是的,他們當然可以,但這仍然需要大量的組裝:專業的FPGA能力,專家的系統級能力......編寫軟體。捕獲乙太網數據包的呼聲變得如此之大,以至於我們說:“我們到底在做什麼?我們為什麼不做一個交鑰匙的例子,而不是生產基本上是一次性的例子(我們通常提供我們的IP核來讓人們開始),為什麼不做一個交鑰匙的例子呢?我們將要討論的“TK”和 TK242 代表交鑰匙工程。

交鑰匙工程,如 COTS......對於不同的人來說可能不同的東西,但這個想法是使用COTS板(BittWare等公司的現成FPGA板)和系統(OSS等公司的金屬邊緣PCI系統),最重要的是(從我們的角度來看)我們的IP-我們可以生產一套軟體:一個比特流。將COTS板從BittWare製造的卡轉變為能夠解決最基本的數據包捕獲問題的數據包捕獲解決方案,本質上是我們聽到的所有請求的威恩圖的交集。

我能不能再多花一點時間,不從每個人那裡偷走太多時間布萊恩?

(布萊恩)哈,是的,當然,你多抓一點時間!

(謝普)我想走得更遠一點。所以,我剛才說過,我們想做商家網卡做不到的事情。因為很明顯,如果你能買一個1000美元的網卡,把它插到乙太網上,然後編寫一些軟體,你就完成了,那麼FPGA增加了什麼?我們是什麼...我們處於什麼價值?你在那裡做什麼?

(布萊恩)右。

(謝普)我們收到的請求類型是線路速率(乙太網速度),這些速率高於商戶網卡可以完美捕獲而不會丟棄數據包的速度。在大多數情況下(也有例外),人們只是不能丟棄數據包。丟包就像錢從你的錢包里漏出來或測試不及格——你不能這樣做。

事實證明,在試圖找到最佳點的威恩圖中——再次,將時鐘撥回 18 個月左右——最佳點是記錄任何數據包大小的 100 Gb 對話的雙方——無論是 60 位元組的微克還是 9 KB 的巨型數據包——記錄每秒 100 Gb 雙向傳輸的最壞情況(大約是每秒 200 吉比特)——因此每秒 200 吉比特的數位(或大約每秒 25 GB)是我們非常清楚地看到的最佳點。

您無法從英特爾或 NVIDIA Mellanox 獲得現成的 NIC 來執行此操作。當數據包大小變小時,它將丟棄數據包。它不知道是什麼...它無法處理。它不會那樣做。

但是,使用我們的DMA引擎和PCAP硬體將這些部分組合在一起的FPGA應用可以做到這一點。所以,我們把它們放在一起。

推動 200 Gbps 的另一件事以及為什麼 200 Gbps 有點神奇是,18 個月前還沒有第 5 代 PCI。沒有...第 5 代...正在開發中。規範已經寫好了,但它並不存在。因此,每秒 25 GB 或 200 GB 的數位非常適合第 4 代 x16 PCI......18個月前。事實證明,它今天也非常適合 Gen 5 x8(稍後會詳細介紹)。

認識到這些東西並不容易,我們必須著手處理它。18 個月前,我們開始致力於這個 200 Gb 的解決方案,不是因為這是全部和最終目的,而是涵蓋了我們聽到的大量客戶。

需要明確的是,有些人進來說,“我們不需要 200 吉比特。也許我們錄製的東西比這少,在這種情況下,一些儲備頻寬很少是一件壞事。

對我們來說,COTS 是關於 Atomic Rules 能夠翻轉其 IP 模型,這需要專業的 FPGA 能力、專業的軟體工程能力、磁碟系統和硬體方面的專家能力。把它翻過來,說:“你知道嗎?原子規則將有(如果我們用錯了方式,請原諒我),但我們稱它為數據包捕獲問題的交鑰匙解決方案,我們已經完成了工程設計,我們的比特流載入到BittWare卡上,並將其從可以做任何事情的FPGA卡轉換為非常具體的數據包捕獲解決方案。

你帶上你自己的硬體,從某種意義上說,你帶上你從BittWare得到的電路板,你帶上你從OSS得到的磁碟系統,或者你選擇把這些碎片組合在一起的任何地方,然後你就開始比賽了。我們玩得很開心。

乍得

嘿,我只想在這裡快速跳入,以解決它的整個 COTS 上市時間方面,對吧?因此,正如我之前提到的,我們正在採用這些特定供應商提供的最新、最出色的 FPGA 技術。它們在生產設備中不是第一位的。BittWare將在設計這些卡之前獲得一個非常大的領先優勢,甚至在他們所謂的工程晶元可用之前。這使我們能夠獲得這些卡,將我們所謂的搶先體驗單元提供給客戶和合作夥伴,例如 Atomic Rules,他們可以在生產晶片可用之前開始開發這些卡。

因此,這些都是複雜的設計,需要經過反覆測試和模擬,並在反覆運算過程中一遍又一遍地優化IP。所以,我認為這是商業現成的一個重要方面:當生產晶元準備就緒時,BittWare卡就在那裡,生產晶元已經準備好了。

尼科萊特

這就是你真正適應的方式。我的意思是,我想問你,隨著FPGA變得越來越複雜,BittWare是如何適應的,以加速使用這些元件的應用的上市時間?我想你已經在那裡解決了其中的一些問題,乍得。

乍得

是的。。。不僅如此。所以,另一件事是我們已經建立了超過 30+、34 年的廣泛知識庫。

你知道,令人驚訝的是,這些卡最困難的事情之一就是PCIe設計。它曾經容易得多,但是由於現在這些PCB上的信號速率和功率要求,構建PCIe外形尺寸卡非常困難(該卡的寬度有限,因此它插入插槽並使其滿足......基本上不是過熱)。您知道,我們已經將所有這些知識都內置在這些卡片中。我們有我們的 BMC,它將監控卡的運行狀況並在需要時將其關閉。

但是,如今,以我們放在它們上的速度和饋送來設計這些卡有很多複雜性。

布萊恩

那麼乍得,為什麼BittWare與Atomic Rules和One Stop Systems等公司合作,提供TK242等解決方案,而不是...在內部進行所有操作?

乍得

當然,我認為最簡單的答案是這很難,對吧?(笑)我認為 Shep 之前提到過,為這些卡開發 IP 所需的專業知識與開發實際硬體本身是不同的。

現在,我們當然可以投入更多的資源,開發我們自己的解決方案,但你必須經常嘗試達到正確的目標,否則工程師團隊可能不是最好的投資回報。

因此,通過與 Atomic Rules 等 IP 供應商合作(您還可以存取我們的網站並查看其他幾個),我們正在挑選市場上一流的 IP,與這些團隊合作,並要求他們基本上在我們一流的硬體產品上獲得他們的解決方案。

然後,我們能夠與 One Stop 合作,獲得可以針對任何最終應用進行定製的系統。我們現在可以提供整個系統作為解決方案,而不是給某人一個空白的FPGA卡,他們必須自己去設計所有這些。

吉姆

我想說的不是定製的,而是現成的可配置的。

(查德)是的,這是一個更好的詞。

(吉姆)對我們來說,可配置的現成部分是能夠選擇伺服器和擴展,然後是BittWare卡和放置正確的軟體,如Atomic Rules,以實現該解決方案的重要組成部分。

(布萊恩)我們確實有問題,所以我們將推遲回答其中一些問題,直到我們進一步進入對話。

尼科萊特

具體來說,對你來說,吉姆,所以我們要推遲!(笑)因為我們想要...如果可以的話,謝普......我們談論的是 TK242......您能否簡要介紹一下TK242及其一些「無需程式設計」的功能,以及它如何在COTS解決方案中使用戶受益?

夏普

謝謝你,妮可萊特,我很想跳過它,如果我走得太久,就虛擬地把東西扔給我。

(妮可萊特)不過,我不想打破我的螢幕,Shep!(笑)

乍得

在你去Shep之前,有一件事,這就是我們與像你這樣的公司合作的原因之一,因為你花了無數天、幾個月、幾年的時間來開發這個IP,對吧?

夏普

是的,我們有。

 所以,我將拋出一個框圖,當我們進入具體細節時,我會稍微談談。但是,在我開始四處走動與螢幕上的積木交談之前,我會和你談談 TK242。順便說一句,正如我之前提到的,“TK”代表“交鑰匙工程”。242 數位的神奇之處在於有兩條 100 GB 的路徑。我們想要一個 4,因為如前所述,它是針對第 4 代 x16 調整的,因此是 200 Gb 數位,誰不喜歡產品中的數位 42?(笑聲)

因此,通過「交鑰匙」(我們將一遍又一遍地回到這一點):沒有FPGA程式設計。這是我們完全交付的在電路板上運行的比特流,因此我們不必談論 FPGA 供應商工具......軟體也是如此,我們也會談到這一點。

雖然是的,可以使用C,C++和Python API,但我們作為開原始程式碼為TK242提供了完整的Linux服務,一旦安裝了該服務,您所做的就是打開系統,並且永遠捕獲的每個數據包(高達200 Gbps)都存儲在無限緩衝區中。主機上的PCAP檔。沒有比這更簡單的了。

讓我深入一點,這樣我們就可以瞭解正在發生的事情的機制。這裡的TK242,實際上是BittWare卡上的一個覆蓋層。我們想在某個地方展示它的圖片。這是一塊半高半長的板子。我們沒有專門針對這款板,但我們真的認為這張卡的物有所值,因為它已經從Mouser上下架了。無恥的插頭:如果人們想嘗試 TK242 並在明天開始運行,請挑選一個盒子,在那裡拿到卡,下載我們的安裝包 - 這是一個安裝所有內容的腳本 - 插入您的連接器,您的數據包將無限流式傳輸到磁碟。

讓我們來看看...我將快速流覽 FPGA 內部的一些部分,因為人們可能想知道「嗯,你知道——你是如何進行數據包捕獲的?我提到了我們如何做商家 NIC 做不到的事情。讓我稍微談談它們。

因此,我們有兩個並行的 100 Gb 採集通道。它位於 QSFP-DD 電纜上,因此如果您使用的是 100GBASE CR4,則可以使用分離式電纜將其分開。它可以與 DAC 電纜、有源光纜配合使用——沒關係。

TK242 的整個數據路徑配置為每秒 3 億個數據包和 200 Gb 的數據包。因此,正如我之前提到的,TK242 在某些方面有點像 Atomic Rules 最熱門的 IP,而您不必集成它,因為當然,我們將其放在一起。

我們的 TimeServo 系統定時器具有納秒級解析度時間,並且可以將其饋送到最大。每個到達的數據包(L2 數據包)都以納秒級解析度標記。當它們到達時,我們將它們排序為一個流,以便它們在合併方面以單調遞增的到達順序排列。

我不會在這裡討論它(但如果人們願意,我們可以)。我們有一個深度 VXLAN RSS 數據包處理器,一個包含 64,000 個條目的流表,我們可以(如果願意)將每秒 200 Gb 的合併流拆分為四個不同的流。假設我們想過濾掉某些數據包,並將某些數據包發送到不同的PCAP檔。事實證明(我們在完成所有這些工作后發現)絕大多數用戶確實想要一兩個,而不是很多,PCAP檔。但是硬體被配置為一次運行四個,如果您想將每秒所有 200 Gb 或每秒所有 3 億個數據包彙集到一個 PCAP 檔中,我們將這樣做(無論數據包大小如何,我們都不會丟棄任何數據包)。

這就是 P2PCAP 引擎,我們基本上是在硬體中製作一個行業標準的 PCAP 檔,因此主機 CPU(Linux 處理器)對實際數據的接觸為零。從那裡,它進入我們的 Arkville DMA 引擎和主機記憶體,在那裡它是一個反彈,後續的 NVMe 儲存系統正在對磁碟進行寫入(實際上是從主機記憶體中讀取),所有這些都以高達每秒 200 GB 的速率順利發生。

這就是故事,顯然一路上有很多舞蹈要到達那裡。

我們將與 Jim 和 Chad 進行一次單獨的對話,討論哪種存儲系統適合所有人。“因為我們在這次奧德賽中學到的一件事是,例如,一年來我們發現,對我們來說,200 Gb - 或者更多,我的意思是顯然......我們今天使用 Gen 5 x16 每秒 400 或 500 Gb 的速度......Gen 4 x16 介面被限制在每秒約 25 GB 的範圍內,但將相同的輸送量傳遞到磁碟完全是另一個挑戰,而這正是我們的軟體 TK242 服務所要做的。

我不會說那裡有魔力。有編碼——所有的部分都放在一起......掛在一起讓它工作 - 但擁有一個整天完美吞下每秒 200 GB 的磁碟系統肯定不是一個“噱頭”。可以肯定的是,您的Ubuntu操作系統所在的一個小 M.2 Chiclet 是不夠的。您將需要某種 RAID 解決方案 - 這是有趣的部分 - 幾乎每個應用程式都不同,我們為您敞開大門,讓您自帶合適大小的硬體來處理該存儲。“什麼是持久性,什麼是容量,什麼是可靠性?”你決定了——它不是原子規則或BittWare或OSS告訴你你必須做什麼。讓我在那裡停頓一下,因為我不想壟斷......

布萊恩

我有一個問題。您提到 TK242 可以處理高達每秒 200 吉比特的數據。您能否詳細說明此功能如何滿足較小/較大頻寬要求的各種數據捕獲需求?

夏普

謝謝布萊恩。簡而言之,很明顯,有兩個 100 Gig MAC(它們的有線速率訂閱可以漸近接近 100 Gb)這一事實是 200 GB 的來源。我還想出了一個事實,這並不完全是巧合,這大約是 Gen 4 x16 的適當頻寬的極限,這是我們設計它的最佳點——這就是為什麼這在今天的商業上如此實惠,對吧?

今天,你仍然在為第 5 代技術支付溢價,但第 4 代實際上已經開始大量出現,正如 Chad 之前提到的,很多東西都使第 4 代走向成熟(現在是,現在是用戶收穫它的好時機)——但並不是每個人都需要捕捉 100 Gig 對話的雙方。

在乙太網世界中,許多對話並沒有完全訂閱線路的兩邊,因此讓 200 比這個數位少一些(儘管它可能會立即或在一段時間內達到 200)是可以的。擁有額外的頻寬實際上不會花費您太多,因此配置 200 個頻寬並不可怕。

但事實證明,有些人對純輸送量的要求要低得多。在純粹的乙太網意義上...也許您只有一個 40 Gb 乙太網路或 25 Gb 乙太網 - 所以很明顯它成比例地更少 - 所以......太好了,這是錦上添花。

事實上,今天有一些 TK242 用戶特別要求 10 Gb 鏈路而不是 100 Gb 鏈路——他們將其降低了整整一個數量級。所以不是 200 個,而是 20 個,他們是這個產品的商業使用者,他們發現它在這個意義上很有用。因此,並不是每個人都必須突破這個限制。

另一件(這是......再次為這裡的更多討論打開了大門)我們剛剛對用於錄製數字廣播的 TK242 的採用感到興奮......數位中頻:VITA 49、DIFI。從本質上講,I/Q 流從 5G 和 ORAN 中的 A 到 D 轉換器以及無線電中流出,其中流量不一定是 TCP 閒聊或 UDP 以一種或另一種方式傳輸——儘管通過 UDP 發送它是一種選擇——但流......輸送量...這不是由乙太網連接的線速決定的,而是由捕獲該頻譜的 A 到 D 轉換器的精度和採樣率決定的,然後我們將捕獲該頻譜。

因此,對於TK242的用戶來說,這是一個絕佳的機會,他們基本上是在從A到D轉換器的同步流上打包器......從他們的頻譜分析儀...從他們的解換器...不管它是什麼,連續時間的東西。它本質上是他們想要捕獲的數據包的無限流。他們以較低的速率將其轉換為數據包,在大多數情況下,我們看到這個數位下降到明顯低於 200 吉比特。也許它的比例介於每秒 100 吉比特和 200 吉比特之間。

所以,我認為,雖然從802.x合規性的角度來看,一年多來我們一直專注於“哦,天哪,有什麼我們無法捕獲的乙太網嗎?”,但很多使用者都說,“我們永遠不會這樣做。我們的轉換器每秒有如此多的千兆採樣,每個採樣的比特數如此之多,它將是一個以該速率打包的同步流。乍得,你可能想修飾一下。

尼科萊特

我想把它帶回一些產品,因為我們實際上對一些與產品相關的功能有更多的問題,所以乍得,去吧。

乍得

當然,我們這裡有幾種不同的產品,Shep 正在開發這些產品,我們正在努力滿足一些射頻問題,所以我會進入這個領域。

但是,對於目前使用英特爾 Agilex 卡的網路產品的基本情況,Atomic Rules 正在實施 TK242,並且我們已經達到了...我們有多個 400 gig 連結(顯然還不能被 Arkville 上的主機使用),但就我們的 420f 而言,例如有兩個 200 gig 流,他是......他剛才的框圖正好適合那個產品。

所以,有 420F 配備 Gen 4 x16,我們現在正在開發......好吧,我們正在運送我們的 IA-440i,這是一款具有 Gen 5 x16 的 I 系列,這些產品將邁出下一步,並可能將那裡的頻寬增加一倍。

但就射頻領域而言,我們有一個產品——RFX-8440——它基於 AMD 的 Zynq UltraScale+ RFSoC 晶片,該晶元上內置了 ADC 和 DAC,正如 Shep 提到的,我們將這些數據數位化,然後我們可以通過標準 QSFP 連接埠將其發送,這些埠直接連接到我剛才提到的另外兩張卡。實際上,不僅僅是兩張,而是我們提供的兩張低調的卡片,我們可以從頭到尾提供完整的解決方案,這太棒了。

尼科萊特

所以我們實際上...我們有一個用戶的問題,“BittWare卡上的TK242是否從CPU上卸載了標準NIC不會的任何形式的卸載,如果是的話,是什麼以及如何卸載?

夏普

哦,完美的問題!這聽起來幾乎像是我會問的一個問題。所以我猜......

(布萊恩)(笑)

(查德)你會問自己嗎?

(布萊恩)他就是這樣解決問題的,他問自己問題,然後......(笑聲)

(查德)這是正確的做法。

(謝普)一會兒,我會很快地把我的屏幕恢復過來。所以,有一件事你之前可能聽我說過,「......做基於商用 ASIC 的 NIC 無法做到的事情“,為了提供 200 Gb 的無丟棄數據包捕獲功能,有一個關鍵部分(在卸載中,在硬體中)是 NIC 不做的,而我們正在做:那就是在線(在硬體中,在 FPGA 中)將數據包流轉換為 PCAP 檔。

單個數據包不可能在PCI總線上移動(具有TLP的開銷),例如,如果存在64位元組微克的遊行,您實際上將能夠捕獲200 GB的速率。

我們設計的是FPGA中的電路,用於將集合P聚合到PCAP...將發送到單個 PCAP 的數據集合(在硬體中進行卸載),並實際上讓我們的 DMA 引擎移動一個咬合真實的數據流(換句話說,逐位元節,它與 PCAP 檔相同,因為您希望在磁碟上看到它)並將其降落在主記憶體中。

這一點我怎麼強調都不為過。主機處理器(編排所有這些的 x86 CPU)從不接觸單個數據。不要為 NVME 驅動器重新組織它,不要移動它或放置標題......或者拿一些東西或對齊它,以便它可以正確存儲或讀取。

因為我們在硬體中完成了所有這些工作,所以我們不僅通過這種卸載減輕了主機 CPU 的負擔,而且還簡化了存儲系統,因此無論您運行的是 HFS、NTFS、XFS(您想要的任何文件系統——原始數據——您想要的後端),實際的 NVMe 請求提示(存儲系統本質上是從記憶體中讀取數據並將其寫入固態單元)都不需要任何重組。

現在是對立面——因為有一種......這算是“好消息”。“壞消息——”嗯,這並不是真正的“壞消息”,但需要明確的是,TK242是一個固定的比特流。它做它所做的事情。這是一個覆蓋層,它使BittWare卡,例如,具有這種數據包捕獲能力。

它不是一個 SmartNIC,它不是一個 FPGA 包,你可以進去說“我想做一個 TCP 解碼”,或者“我想做一些壓縮”,或者“我想做一些加密”(順便說一句,這些都是我們非常渴望與任何想要做它們的客戶進行討論的事情),但這不是 TK242,它是 COTS 交鑰匙, “這裡是......這就是它的作用。非常感謝你的問題。

布萊恩

我有一個問題。Atomic Rules 如何驗證 TK242 的輸送量性能,尤其是在特定硬體要求下?

夏普

好。簡而言之,我們把它分解成碎片——它是分而治之。(結束語)我們不需要...就停在那裡。

簡單來說,我們將驗證問題分為實現從FPGA卡到主記憶體的輸送量(然後在存儲系統中,從主記憶體到磁碟),然後進行整體測試。

在這一切開始之前,一切都從 CI 和 CD(持續集成、持續開發)開始。我們有一個精心設計的、廣泛的Jenkins工作臺--它不是大多數使用者所熟悉的傳統意義上的CI/CD的Jenkins--我們有大約二十幾台伺服器(來自英特爾和AMD),這些伺服器的板子來自BittWare、英特爾、AMD、Nvidia和其他公司,我們不只是在我們所有的軟體上運行標準的Jenkins管道。我們實際上是在編譯 TK242 比特流,並在硬體中一遍又一遍地運行應用程式。

因此,一年多來,我們一直在 24/7 全天候運行數十個系統(在本地花費大量費用),例如,證明 DMA 引擎並能夠為任何好奇的人提供確鑿的客觀證據,“你怎麼能向我證明你從不丟棄數據包?順便說一句,我們也可以通過檢查(通過查看代碼和流量控制的方式等)來做到這一點。

這讓我們進入了主要記憶。獲得...但是,僅使用主記憶體並不能成為數據包捕獲解決方案,任何走過這條路的人都非常清楚這一點。我們還做了一組類似的測試(我會說這對我們來說有點新 - 它更像是像 OSS 這樣的公司的駕駛室),以驗證從主記憶體到存儲系統的輸送量是否同樣具有性能,或者至少具有適當的性能,以滿足目標。

只有當從FPGA到主記憶體以及從主記憶體到磁碟的移動令人滿意時,您才應該考慮進行端到端的實際分析,以確保兩者的結合仍然以這種方式保持性能。

我們的後背被殘酷的現實所傷痕纍纍,我們可以將每秒 240 吉比特的速度移動到主記憶體中,然後說,“哦,我們不是很棒嗎?我們可以使用 FIO 等標準 Linux 工具對從主記憶體到磁碟的突發性能進行基準測試,“哦,看,再有 220 個磁碟到 12 個驅動器的條帶化磁碟陣列中,我們應該沒問題,對吧?(發出蜂鳴器聲音)錯了,不!

在...主要是在 Linux 服務(我們開發的,我們隨 TK242 一起提供)中,我們對其進行了平方並提供驗證工具,因此,如果您獲得卡並在其上載入 TK242,我們要求您做的第一件事就是運行測試套件來幫助驗證該性能。TK242 沒有顯示在這些框圖上,但我們有內部數據包生成器,具有可整形的流量,可以上升到每秒 256 吉比特。我們上下運行整形掃描來測量主記憶體的輸送量,一直到磁碟的輸送量,在你的系統上,在你的主機板上,在你的磁碟系統上,你自己(不是Atomic Rules,不是OSS,不是BittWare)將有一個很難客觀的數位去“哦,看,我想這就是我的表現。

我們能保證這種性能嗎?絕對不是,我們不知道你的架構是什麼,但我們敏銳地意識到這不是一個「噱頭」......您帶錯了磁碟系統...您沒有將足夠的記憶體 DIMM 塞入系統...你的貓在處理器上灑了一堆水......在這些條件下,你可能不會得到200千兆位,但我們可以測量。

尼科萊特

好了,我想請吉姆來,因為我們有幾個問題要問吉姆,你知道吉姆,你之前提到過一站式,所以這是一個完美的時機。Jim,您為什麼不為我們描述一下 AI 可移植在 COTS 數據記錄器的背景下意味著什麼,以及它如何影響性能和可用性?我們將從那裡開始。

吉姆

您一直在查看我們的網站,其中有 AI 可移動一詞......

(布萊恩)(笑)那是在做你的研究!

(吉姆)......我知道 Chad 之前提到過 AI,很高興聽到 Shep 說這些速度和饋送以及所有東西如何進入伺服器和系統,因為這就是我們在 OSS 所做的。

對我們來說,人工智慧可行動裝置是......我們不想說像移動人工智慧這樣的東西,這是......人們會想到手機之類的東西,但我們真的把數據中心級的硬體放在了這樣,這樣我們就可以從BittWare硬體和Atomic Rules軟體中獲得這些速度和饋送。

因此,人工智慧可移植設備:我們將整個人工智慧工作流程視為開放源碼軟體帶來大量價值的地方。那裡有數以百萬計的感測器,而BittWare卡是將這些感測器放入你要存儲的數據集中的方法,而Atomic Rules使這個交鑰匙變得容易。實際上,感測器攝取是數據記錄器的一部分——如果你談論的是自動駕駛汽車,數據記錄器——類似的東西,是人工智慧工作負載的前端。

所以,我們真的給了這些高端硬體系統,比如我們的SDS伺服器,這是Shep在Atomic Rules總部一直在敲打的伺服器之一......並獲取所有這些數據。

然後接下來就是你必須推斷這些數據。因此,我之前談到的規模類型(我稍後會談到有關PCIe通道的問題)是我們允許...現在,如果您願意,甚至可以在同一系統上使用 GPU 處理這些數據,將其轉換為可用於可視化或類似內容的形式,具體取決於您引入的感測器數據。或者,根據你的 AI 推理做出決策——這是拼圖的下一塊,我們(因為我們與 Nvidia 的關係)將其中的一大塊帶入了 AI 工作流程。

這就是 AI 可移動的概述......正在獲取所有這些部分,但在邊緣完成所有這些工作,而不是在亞馬遜雲中,而不是等待兩個小時來發送您想要的所有數據(甚至通過 100 Gb 的互聯網連結......現在非常昂貴),但如果需要,我們有辦法將這些數據傳輸到更大的雲中。但實際上,我們談論的是數據中心級的處理能力,你可以在車輛、飛機、潛艇上完成——諸如此類的事情。

布萊恩

好了,你回答了我的下一個問題。可以部署數據記錄儀(伺服器)的不同應用程式,對嗎?所以,你看到很多車輛,飛機?

吉姆

是的,所以,就......再多一點...從自動駕駛卡車到商業方面,我們做任何事情......這些資料記錄系統...你想像一輛長途卡車在兩天內從美國東海岸到西海岸,而長途司機需要四到五年才能做同樣的事情。這才是自動駕駛卡車真正創造價值的地方。但是那裡有大量的數據被捕獲,所以這是很多感測器都是基於乙太網的應用之一,我們在這裡談論的這個解決方案可以把這些數據帶進來。

其他的...我們提到飛機是......即使在軍事應用中,我們在 P8 飛機等地方也有直升機和大幅面系統,我們正在對所有感測器進行數據攝取:聲納浮標......周圍環境,如果你正在從這些類型的感測器進行可視化輸入,所以這是另一個應用程式。

我甚至提到了潛艇,因為我們正在潛艇中進行聲納處理——數據攝取和處理——無論是在自主潛艇還是有人潛艇中。

所以,這些都是非常惡劣的環境,這就是OSS硬體允許你把你在工作站上(在你的辦公桌上)正在處理的相同產品,並實際地把它們放到這些車輛中。其中大多數...如果您要尋找其他真正的邊緣類型應用程式,您總是必須去......也許您仍在使用第 3 代 PCI Express,或者您使用的低壓處理器確實損害了您想要獲得的性能——您希望看到與工作站相同的性能,但您希望在車輛中擁有它。這就是我們為該解決方案增加價值的真正原因。

尼科萊特

嗯,你知道,解決傳輸這些大數據量的挑戰是相當關鍵的,對吧,比如 500 TB?我們能多談談你的解決方案是如何解決這個問題的嗎?

吉姆

是的,最大的問題是,現在你已經有了所有這些感測器數據:你可能會在從倫敦飛往紐約的飛機上獲得PB級的數據——你剛剛以如此極端的速度收集了TK242,而且你已經連續收集了七、八個小時——現在你把它放在一個磁碟或一組磁碟上。

因此,我們擁有的解決方案之一是——我談到了將其發送到雲端進行處理可能需要數周時間——我們的大多數系統都有我們所說的數據罐。因此,我們在 SDS 伺服器上有兩個數據包,該解決方案已在其上進行了測試,適合...現在擁有 60 TB 的驅動器,我們已接近 PB 級。然後,我們可以將這兩個驅動器包取出,然後通過FedEx在一夜之間將它們發送到世界任何地方,而不是花兩周時間才能獲得那套...PB 級資料...從電線上。

因此,這種數據包概念使飛機降落、取出驅動器包、將其插入您的數據中心或您在機場的數據中心非常便攜,您現在已經上傳了所有數據,因此您可以非常快速地使用它。

布萊恩

所以,我們有一個問題要問你,來自謝爾蓋的吉姆。例如,當只有 8 個通道可用時,如何將 PCIe 通道擴展到 128 個通道?您使用的是什麼擴展器?

吉姆

所以這是一個很好的問題,因為我可能在鏈接和車道之間有一些混淆。

使用PCI Express,我們可能有4或5個x16插槽或x8插槽,我們將BittWare卡放入其中,以便攝取數據。但是,如果您需要將其擴展到更多卡,我們使用PCI Express交換來獲取其中一些產品(它還支援Atomic Rules以非常快的速率(線速率)執行的所有 DMA,延遲為150納秒,因此幾乎不明顯,甚至沒有緩衝幀或類似的東西)......但是PCI Express交換機可以讓我們轉到第二個機箱(我們稱之為擴展器)並將更多插槽擴展到......如果您的數據集比我們從單個SDS伺服器談論的更大,則能夠添加更多卡或添加 GPU 或添加更多 NVMe 驅動器。

因此,當我們談論如何擴展解決方案時,您從交換中獲得的PCI Express扇出更多。

布萊恩

因此,噪音也可能是一個重要的...哦,對不起。

(妮可萊特)不,不,繼續,繼續。

(布萊恩)...在車輛中,基於高性能應用可能是一個重要問題嗎?一站式系統實施了哪些創新或措施來解決這個問題?

吉姆

是的,所以,當你是那些......說到潛艇類型的應用,首先,你要在潛艇里保持安靜,特別是如果它是一艘軍用潛艇,而且那裡有人。如果你現在進入伺服器機房,你知道,你會在85分貝及以上時大聲尖叫。每個人都需要耳朵保護等等,當你試圖在水下隱身時,你真的無法處理這種噪音。

因此,我們討論的 SDS 伺服器具有獨立液體冷卻的選項,我們使用更好的液體冷卻效率。因此,伺服器中的熱交換器仍然停留在這個短深度包中,以便能夠適應那些緊湊的應用,以及我們正在談論的這些車輛,但將噪音水準從85 dB降低到60到65,這更像是辦公室聊天類型的環境, 所以你實際上可以......不要因為高端伺服器的持續無人機而發瘋。

因此,我們將冷卻和電源作為將這些類型的數據中心型產品引入這些車輛應用的關鍵方式,甚至將液體浸沒式冷卻添加到我們的曲目中:因此,我們可以將所有這些浸入液冷罐中,讓它在那裡運行三年, 收集數據並記錄下來,無需觸摸它,因為它都處於恆定溫度下,並且實際上沒有噪音。

尼科萊特

好了,我們還有幾個問題——我知道我們要到最後幾分鐘了。謝普,讓我看看......是的,讓我們給你這個,Shep。

那麼,既然提到 TK242 卸載了 PCAP 格式,這是否意味著 libpcap 在 Linux 系統上不起作用,只是為了澄清一下?請告訴我這些話是否正確。

夏普

(笑聲)你知道這是字母湯,你說的一切都恰到好處。

讓我來解決這個困惑......不應該有:libpcap 很棒。它是一個軟體API,它可以在Linux上運行,也可能在Windows上運行。無論是製作PCAP檔還是解碼它,它都是一個軟體 API——它在軟體中運行,它將使用週期。它在進出途中觸及數據流的每一口。

正是為了避免這種接觸,這樣在數據的任何階段都不會有主機參與,或者......在進入的過程中,我們在硬體中、在卸載中執行此操作,因此主機無需執行任何操作。

我們是否可以在 TK242 中刪除 P 到 PCAP 引擎,而只刪除 DMA 資料以像 NIC 那樣託管?當然,人們確實使用...以這種方式獲得IP。您不會獲得 200 Gb 的性能。即使是最快的 AMD 和 Intel 處理器,擁有數量驚人的內核,也會以這種速度窒息,並且會出現與之相關的所有軟體抖動。

所以再一次,總而言之,libpcap 工作得很糟糕。它是一個軟體應用程式,它有它的位置。在即時捕獲系統中,它沒有立足之地,因為觸摸數據可能意味著數據被丟棄。

尼科萊特

好吧,我們還有另一個問題。

(布萊恩)......看起來乍得確實直接回答了這個問題,但是......

(妮可萊特)不,不,我還有另一個問題。

(布萊恩)好吧,你還有另一個,好吧!(笑)

(妮可萊特)所以,它指的是......我要回到裸機上一秒鐘。當與FPGA相關聯時,我們聽到並讀到了「裸機」這個術語,我想知道您是否可以花點時間為我們解釋一下這個概念。

乍得

當然。所以,裸機是......主要是現在聽起來的樣子(多年來情況發生了變化)。我的意思是。。。FPGA過去只有邏輯單元,必須有人自己實現一切。

現在,這些天他們擁有用於PCIe和 DDR 控制器以及乙太網的硬IP塊。而BittWare--為了加快開發時間並測試我們的硬體--我們有幾個FPGA設計人員,他們必須正確地對這些模塊進行參數化(知道如何在這些模塊之間進行通信),所以,要麼實現示例,要麼在其中進行卡測試。其中——邏輯單元——介於它們之間的空邏輯單元。

但。。。事實上,它位於這些硬IP塊之間,這使得Atomic Rules能夠利用FPGA內部的大量資源(即空邏輯單元)來實現一個高度定製的解決方案,該解決方案正是根據我們想要它做的事情而定製的。這就是為什麼FPGA卡在許多不同的市場中如此通用的原因。因為它們可以以許多不同的方式進行配置,老實說,可以執行許多不同的應用程式。

尼科萊特

謝謝乍得。大家好,我們從觀眾那裡得到了很多好問題。布萊恩和我有一些問題要問你。有什麼我們沒有問的,你認為我們應該有的嗎?(停頓)我想謝普能想到什麼!

(布萊恩)(笑聲)我看到Shep在那裡處理,在那裡。

夏普

好吧,乍得和吉姆,當然還有其他在線的人......一個問題可能會出現,但讓我捎帶乍得關於裸機的評論,因為這值得思考。

有了 TK242 作為交鑰匙解決方案,我們盡可能遠離裸機,從某種意義上說,TK242 的營銷觀點是「Phooey FPGA!沒有...RTL 查找表...都不好!

我們正在交付...我們把我們的身份——這個比特流——載入到BittWare的一張卡上,它就有了這個角色,把這件事做得很好。

對於我們認為對這種能力感興趣的非零人,「哈利路亞!而不是所有的研發和所有其他......你得到了COTS的所有價值,你就可以開始了。

但是,OSS...BittWare...原子規則:我們都有另一面(正如我在這次電話會議中多次說過的那樣)。TK242:從某種程度上說,它就像是《原子規則》中所有IP中最熱門的作品。

乍得關於裸機的觀點......我們認出這個電話裡的人:你很敏銳,你看著這裡,“哇!我敢打賭,如果我們能把我們的能力放進去——我們有一個壓縮、加密或任何......射頻信號下變頻...一連串數據包進程中的任何其他......”

TK242 不打算這樣做......但你肯定會在這裡與BittWare、OSS和Atomic Rules的正確人談,他們可以通過把圖像顛倒過來來完成工作,“你敢打賭,我們可以把你的秘密醬汁放在那裡!但同樣,對於今天關於我們的交鑰匙設計的所有報導(我們感謝我們今天關於交鑰匙設計的所有報導),這不是交鑰匙設計,而是將各種部件的元件組合在一起,並使用我們的元件IP更快地進入市場。

所以希望乍得,我沒有把你所說的裸機弄得一團糟。

你知道,看,Atomic Rules的團隊 - 我們喜歡我們必須用FPGA繪製的畫布。如今,Nvidia 和其他公司的 GPU 與主機處理器之間擁有豐富的異構處理器,這意味著系統軟體和 RTL(現在比以往任何時候都更加)齊頭並進。

它不再是...這不僅僅是一個FPGA問題和一個系統問題,這就是為什麼TK242不僅僅是一個比特流。TK242 更像是 Linux 服務,它比比特流更負責數據包捕獲工作(同樣,取決於您在 Atomic Rules 上與誰交談)。

所以,我認為,裸機總是為那些想要深入研究它的人而存在的。嘿,如果你的音量足夠高,讓我們開始談論 ASIC,讓我們真正脫下手套(我想每個人都知道這是可用的)。

但是,今天我想結束的演講的主要內容是,今天在座的所有供應商的這些部分的COTS可用性如何使數據包捕獲過程民主化,以便任何想要開始並做到這一點的人都不會面臨這個巨大的時程表或巨大的經濟障礙,以便看看他們是否可以帶來他們的附加值(即捕獲和獲取數據)來做一些事情。

乍得

是的,我想你擊中了它的頭,謝普。看,像 Atomic Rules 這樣的公司能夠提供......有時IP塊,其他人必須在後端栓上並做他們想做的任何事情,或者我們可以將這些卡(特別是這個解決方案)出售給不知道如何對FPGA進行程式設計的客戶。他們不需要知道,因為這是一個現成的罐頭解決方案,“交鑰匙工程”。我的意思是,那是......就像他說的,它的名字。

這隻取決於最終用例,我們試圖部署的不同合作夥伴的不同IP,如果有人試圖做一些以前沒有人做過的事情,那麼他們會想要一些裸機的東西,這樣他們就可以真正去程式設計了。但你正好擊中了它的頭。

布萊恩

好吧,感謝您今天加入我們的即時聊天。感謝我們的贊助商:貿澤電子和BittWare,以及我們了不起的小組成員。祝大家有美好的一天。

(所有人)謝謝!