
Arkville Agilex FPGAを用いたDPDKデータムーバー
BittWare WebinarArkville Intel® Agilex™ FPGA を使用した PCIe Gen4 Data Mover Webinar Atomic Rules 社のArkville IP は、最近更新され、Intel をサポートしました。Agilex
近年、NANDフラッシュベースのストレージへの移行とNon-Volatile Memory Express®(NVMe™)の導入により、テクノロジー企業にとって、これまでとは異なる「ストレージのあり方」を模索する機会が倍増しています1。リアルタイムのデジタルビジネスの急速な成長と多様化は、新しい製品やサービスを実現するために、このようなイノベーションを要求しています。
近年、NANDフラッシュベースのストレージへの移行とNon-Volatile Memory Express®(NVMe™)の導入により、テクノロジー企業にとって、これまでとは異なる「ストレージのあり方」を模索する機会が倍増しています1。リアルタイムのデジタルビジネスの急速な成長と多様化により、新しい製品やサービスを実現するためのイノベーションが求められています。そのため、新しいストレージ製品は、より高い帯域幅、より低いレイテンシ、フットプリントと総所有コストの削減というトレンドに沿っており、大規模なインフラに依存している企業にとって重要な改善となっています。最近の市場レポート2では、NVMe 市場は年平均成長率約15%で成長し、2020年には570億ドルに達すると予測されています。NVMe市場は進化を続け、3つの領域でさらなる技術革新を追求しています:
2018年3月、BittWare 、ストレージ市場のニーズに対応する革新的なソリューションを提供する250シリーズFPGA製品を発表しました。250シリーズ製品は、シングルチップでASICクラスの機能を提供するXilinx®UltraScale+™ FPGAとMPSoCを搭載し、ストレージ業界6 の技術ニーズに適合しています。NVMeとリコンフィギュラブルロジックFPGAおよびMPSoCを組み合わせることで、BittWare 、急速に進化する市場において重要な差別化要因となる新しいクラスのストレージ製品を提供しています。ザイリンクスデバイスの柔軟性と再構成性により、20ベースのソリューションは、NVMe標準が新しい機能を随時取り入れているため、最新の状態を維持できることが保証されています5。
本アプリケーションノートでは、BittWareのFPGAおよびMPSoC対応アクセラレータ製品250シリーズを使用して、次世代IoTおよびクラウドインフラ向けの高性能で拡張性の高いNVMeインフラを構築する方法について説明します。
2011年にNVMeが誕生して以来、NVMeコンソーシアムは非常に活発な活動を続けています。実は現在、NVMeプロトコルは、別々の仕様で定義された3つの観点から進化しています。基本的なNVMe仕様に加え、NVMe Management Interface(NVMe-MI)は、通信とデバイスの管理方法(デバイスの発見、監視など)を詳述し、NVMe over Fabric(NVMe-oF)は、ネットワーク上の不揮発性ストレージとの通信方法を説明し、プロトコルがトランスポートアグノスティックであると示す9.
時間が経つにつれて、様々な業界のより多くのユーザーがNVMeを採用し始めると、新しいユーザーは新しい機能の必要性を特徴付け、仕様に対する新しいアイデアを導入します。NVMeプロトコルの採用は今も増え続けており、イノベーションを生んでいます。ハードウェアとソフトウェアの企業は、新しいフォームファクタの導入、新しい製品やアプライアンスの作成などを通じて、メモリにアクセスする新しい方法を見つけています。NVMeエコシステムの焦点は、データセンターやハイパースケールインフラに拡張する手段をユーザーに提供することであり、プロトコル仕様はその方向で進化し続けるでしょう9.
2019年には、NVMeの基本仕様のリビジョン1.4がリリースされ、データレイテンシの改善、不揮発性データへの高性能なアクセス、複数のホスト間でのデータ共有の容易さが実現される予定である。NVMeのユーザー、特にクラウドプロバイダーが待ち望んでいる機能の1つが、IOの並列実行時のサービス品質を向上させるIO決定論です10。バックグラウンドのメンテナンスタスクの影響を最小限に抑え、ノイズの多い隣人の影響を抑えることで、IO決定論機能は、不揮発性データへのアクセス時に一貫したレイテンシーをユーザーに提供します。別の方法として、先に述べたOpen Channelアーキテクチャ11がある。この2番目の方法では、ホストが管理機能の一部を引き継ぎ、データのみがストレージハードウェアに転送されます。この構成では、ホストに対するドライブの物理的なインターフェイスは高速データレーンに限られ、サイドバンドチャンネルは存在しない。この例は、NVMe仕様に変更があった場合の影響と関連性を示し、柔軟なNVMeハードウェア・インフラストラクチャの要件を浮き彫りにしています。
今後数カ月でベース、MI、オーバーファブリック仕様の新しい改訂版が登場するため、NVMeユーザーは、新しいNVMe要件に適応できる柔軟な基盤から恩恵を受けることになります。250シリーズFPGAおよびMPSoC製品は、この柔軟性を提供するだけでなく、今日の顧客の課題を解決し、即座に競争上の優位性を得ることができるのです。
BittWareザイリンクスの FPGA および MPSoC 製品は、最新のザイリンクスUltraScale+ テクノロジーを搭載し、NVMe にますます注力するデータセンターのニーズに対応しています。FPGA は、30 年以上にわたって複数の業界にプログラマブルなハードウェアソリューションを提供し、自動車、放送、医療、軍事などの市場でコンピューティングや組み込みシステムの問題解決に広く使用されています。同時に、近年、FPGAメーカーは、この実績ある技術に、最新かつ最高の統合システム設計の改良を導入しています。
ザイリンクスUltraScale+ FPGA および MPSoC 製品は 16nm プロセスを採用し、高速ファブリック、組み込み RAM、クロッキング、および DSP 処理を提供することでシステム性能を向上させています。さらに、ザイリンクス デバイスは、ネットワークまたは PCIe ファブリックへのより高いスループットの接続のために、より高速なトランシーバ テクノロジー (最大 32.75 Gb/s) を導入しました。UltraScale+製品は、シリアルトランシーバーのチャンネル数が多いため、一度に複数のPCIeインターフェースに接続し、ホストCPUにデータオフロードインターフェースを提供することができます。PLXスイッチをFPGAやMPSoCに置き換えることで、CPUが処理の一部をオフロードし、他の処理にあてることができるケースもあります。また、FPGAやMPSoCのプログラマブル・ロジックは、システムにおいて決定論的で低遅延なインターフェイスを提供し、一部のユースケースにおいて明確な競争優位性をもたらすことができる。
最近のFPGAファミリーは、デバイス・ファブリック内に低消費電力のマイクロプロセッサを内蔵するようになりました。UltraScale+ MPSoC は、プログラマブル ロジックだけでなくソフトウェアも必要とするアプリケーションのニーズに応え、これらを 1 つのパッケージに統合しています。例えば、Xilinx ZynqUltraScale+ ZU19EG は、ハイブリッド コンピューティングのニーズがあるアプリケーション向けに、クアッドコア ARM Cortex-A53 とリアルタイム デュアルコア ARM Cortex-R5 の 2 つの処理ユニットに加え、グラフィック処理ユニット ARM Mali™-400 MP2 を備えています。ZU19EG MPSoCデバイスは、プログラマブル・ロジックがストレージ・データに低レイテンシの決定性パスを提供し、ARMコアが複雑なパケット制御を実行したり、CPUレス組み込みシステムでホストCPUを置き換えたりするNVMe over FabricまたはOpen Channelの実装に特に適した非常に汎用性の高いチップとなります。
ここ数年、BittWare はストレージ業界の最前線に立ち続け、NVMe テクノロジーに基づく製品を開発することでその革新的な成長に貢献してきました。BittWare は、FPGA が I/O ボトルネックを減らし、NVMe ソリッドステートドライブに直接高速決定性パスを提供できることを認識しました。早くも2015年には、BittWare 、XilinxおよびIBMと提携し、革新的なNoSQLデータベースソリューションを開発しました12。250シリーズFPGA&MPSoCボードは、この初期製品の成功に基づき、より深く高速なオンボードメモリ、ネットワーク接続、システムオンチップ、サーバーストレージバックプレーンへのケーブル接続オプションなどの機能を追加しています。
250 FPGA & MPSoC製品ラインは、250S+、250-U2、250-SoCの3つのFPGAアダプタで構成され、PCIeスロット、OCuLink/Nano-Pitch、SlimSAS、MiniSAS HD、U.2ストレージバックプレーンなどのさまざまな業界標準フォームファクターに接続します。250シリーズ製品は、既存のインフラストラクチャのPCIeファブリックにぴったりとフィットし、NVMeストレージデバイスに低レイテンシーで直接アクセスすることができます。
250S+直付けアクセラレータ
シリーズの最初のアクセラレータは、250S+です。このFPGAアクセラレータは、XilinxUltraScale+ Kintex 15P FPGAと、ロープロファイル8レーンのハーフハイトハーフレングスPCIe準拠のフォームファクタに4つのオンボード1TB M.2 NVMeドライブ(合計4TBの不揮発性フラッシュ)を備えています。また、システムにFPGAコンピューティングを導入したいだけで、すでにストレージを用意しているお客様には、M.2オンボードコネクタから、Molex低損失高速ケーブル技術を使用して、OCuLink/Nano-Pitch またはMiniSAS HD NVMeバックプレーンへケーブル出力することができます。KU15P FPGAは、1,143Kシステムロジックセル、1,968DSPスライス、70.6Mbの組み込みメモリを備え、UltraScale+ Kintex FPGAシリーズで最大のデバイスで、付加価値機能を実装するための大量の設定可能リソースを提供します。オンボードのDDR4メモリバンクにより、より深いデータベクタのバッファリングを追加することができます。
DAA(Directly Attached Accelerator)とは?
250シリーズの第2弾は、250-U2です。このアクセラレータボードは、XilinxUltraScale+ Kintex 15P FPGA (250S+ と同じ) と DDR4 メモリの 1 バンクを 2.5 インチ U.2 ドライブフォームファクタに搭載しています。250S+とは異なり、250-U2にはFPGAに直接接続されたオンボードSSDはありません。このアクセラレータの斬新な設計により、専用のPCIeスロットがないシステムでも、既存の標準的なU.2 NVMeストレージの隣にある追加の計算能力を持つU.2ストレージバックプレーンにフィットすることができます。この250-U2製品は、Proxy In-Line Accelerator (PIA)の役割を担っています。
250-U2は、インライン圧縮、暗号化、ハッシュのほか、消去符号化、重複排除、文字列/画像検索、データベースのソート/結合/フィルタなど、より複雑な機能を実行できます。アプリケーションのコンピューティング・ニーズに応じて、バックプレーン集団はNVMeドライブ用の250-U2ボードの比率を変えて表示することになる。250-U2は、ストレージと並んでU.2バックプレーンに配置され、NVMe-MI仕様を活用した他の標準U.2 NVMeドライブと同じメンテナンスオプションを備えています。250-U2プロセッシング・ノードとストレージの両方がホスト・サーバーのPCIeファブリックに直接接続するため、DMAデータ・トラフィックはCPUとグローバル・メモリを完全にバイパスし、SPDKなどの技術を使用してエンドポイントからエンドポイントへのデータ転送を最適化することができます。RDMAまたはピアツーピアDMAソリューションでは、データはCPUを完全にバイパスしてNVMeエンドポイント間で直接流れます。FPGAやMPSoCのプログラマブル・ロジックに直接接続することで、アクセス・レイテンシーを大幅に削減できます(Lusinsky, 201721)。また、このハードウェア・プラットフォームの別の使用例として、オフロード・コンピュート・エンジンがあり、FPGAaaSのスケーラブルなインフラストラクチャにうまく適合するでしょう。
プロキシインラインアクセラレータ(PIA)
シリーズ3番目のアクセラレータである250-SoCは、XilinxUltraScale+ Zynq 19EG MPSoCを搭載し、2つのQSFP28ポート(100GbE対応25Gbpsラインレート)によるネットワークファブリックと16レーンのPCIe 3.0 Host Interfaceと4つの8レーンOCuLink コネクタによるPCIeファブリックの両方に接続することができます。ZU19EGは、1,143Kシステムロジックセル、1,968 DSPスライス、70.6 Mbの組み込みメモリを搭載したシリーズ最大のデバイスです。デバイス・パッケージに組み込まれたARMプロセッシング・ユニットとグラフィカル・ユニットは、ハイブリッドなプロセッシングを必要とする製品に理想的なプラットフォームを作り出します。
250-SoCは、ネットワークからストレージに直接アクセスできる汎用性の高いハードウェアで、NVMe-over-Fabricをサポートしています。NVMe-oFは、ネットワークファブリック上でストレージを分解し、ストレージをリモートで管理するための次世代NVMeプロトコルです。NVMe-oFはまた、SASよりも柔軟性を高め、オンデマンドでネットワークアレイを設定することができます。分散型ストレージやEJBOF(Ethernet Just-a-Bunch-Of-Flash) ハードウェアは、データセンター内のストレージコスト、フットプリント、電力を削減します。
ザイリンクス Zynq MPSoC チップは、組み込みシステム向けにさらなる柔軟性を提供します。MPSoCボードは、ホストCPUから独立してオペレーティングシステムとそのフルソフトウェアスタックを実行することができます。最大2つの100GbEポートをサポートする高帯域幅ネットワーク機能とオンボードMPSoCにより、250-SoCは、NVMe-oFアプリケーションのための外部ネットワークインターフェースカード(NIC)と外部プロセッサの両方の必要性を排除しています13。FPGAベースのNVMe-oFインフラの実装は、データがハードウェアパスを通過するだけなので、シンプルかつ高性能であり、低遅延で予測可能なソリューションとなります。
NVMe-over-Fabric(NVMEoF)」。
250-SoCは、ストレージ業界に柔軟なソリューションの数々を提供します。250S+と250-SoCは、Direct Attached Acceleratorのユースケースをターゲットにすることで、仮想化とセキュリティ強化の必要性に取り組んでいます。250-U2と250S+は、Proxy In-Line Acceleratorとして既存のインフラに簡単にプラグインでき、NVMeストレージに低レイテンシーと高帯域幅のローカルデータコンピュートを提供します。さらに、250SoCは、最新世代のNVMeプロトコルをサポートしながら、ストレージを分離するハードウェアのみの革新的な方法として、NVMe-over-Fabricをサポートしています。NVMe市場が成長を続ける中、FPGAとMPSoCのソリューションは、NVMe製品のアプリケーションの課題を解決してくれるでしょう。
NVMeテクノロジーは、ストレージに破壊的なイノベーションをもたらし、データセンターのインフラに広範囲な影響を及ぼしています。このプロトコルの特徴により、NVMeはストレージに関わる新しい製品やアプリケーションを設計する際に、第一の選択肢となります。
データベース(アクセラレーション )などのエンタープライズ・アプリケーションでは、低レイテンシと高帯域幅の4Kまたは8Kデータ書き込み転送速度が求められますが、この2つの要件はNVMeプロトコルの長所に完全に適合しています。このような特性から、NVMeはREDOログの実装に適しています。例えば、多くのトランザクション記録が保存され、データベースが故障した場合に将来再生されるようなユースケースです。このユースケースにおいて、250S+は最大4TBのNVMeストレージをFPGAリコンフィギュラブル・ファブリックの端に直接持ち込み、トランザクション記録を高速でSSDに集め、再生に備えます14。
NVMeはまた、仮想化インフラの課題を軽減し、IOが最も一般的なボトルネックであるVM(仮想マシン)、ステートレスVM、SRIOVの実装を簡素化します。ステートレスVMの使用例では、IT管理者は、企業ユーザーが変更しないOSイメージをロックダウンする必要があります。ユーザーは自分のデータだけを変更し、OSイメージはNVMeストレージで変更されないままである。このようなITインフラでは、NVMeストレージは複数のユーザー間で共有されます。250S+は、このアプリケーションを実現するためのオールインワン・プラットフォームです。各1TBの物理ドライブはFPGA IPによって分割され、各ユーザーはOSイメージとデータへの分離された安全なアクセスを得ることができます。ハイパーバイザーは、エミュレーションドライバを使用せずに、ドライブの一部への直接アクセスを管理し、このIO制限のあるアプリケーションに優れた性能を提供します。
ビッグデータ」市場は、バッチ処理からリアルタイム処理へと移行しているため、ストレージと処理を組み合わせたインテリジェントなNVMe製品にも機会をもたらしています。Map Redの問題は、バッチ処理ではなく、リアルタイム分析に移行しているため、GFSバックエンドよりもはるかに高速な新しいストレージ階層が必要です。現在ITインフラで見られるストレージの階層化は、ほとんどアクセスされない低速のコールドストレージと、非常に高速なSSD、NVMe、NVMメモリに分けられます。このユースケースでは、すべてのデータはGDFSに記録されますが、その後、より高速なメモリを持つコンピュートノードに移動されます。NVMe-over-Fabricを実装した250-SoCは、高速ストレージと高性能なコンピュート機能へのアクセスを提供するため、これらの両方の要件に対応します。
ディープラーニング業界は、アナリティクスの世界と同様のニーズを持っています。深層学習用の新世代アクセラレータ、すなわちGPGPU、TPU、FPGA;これらのデバイスは、チップの計算能力に見合った大きなメモリ帯域幅を必要とします。学習演算は、この高スループットのデータを大量に消費し、数テラバイトになることも少なくありません15。最近の研究では、FPGAファブリックを使用することで、特定のネットワークタイプのトレーニングオペレーションを高速化できることが示されています。したがって、ストレージと計算エンジンの両方を1つのハードウェアプラットフォームに統合することで、待ち時間を短縮し、トレーニングデータセットが増加しても再トレーニングのサイクルを増やすことができます16。
HPC分野では、250S+のローカルストレージや250-SoCのリモートバージョンは、チェックポイント/再起動、バーストバッファ、分散ファイルシステム、スケジューラからのジョブデータのキャッシュなど、いくつかの用途があります。FPGAファブリック上のストレージの近くでアルゴリズムを実行することで、FPGAアプリケーションのフットプリントは低いまま、ストレージをフル活用し、CPUを他の処理ジョブのために空けておくことができます。ギガバイトのデータが揮発性メモリに保持されているが、定期的にフラッシュにバックアップする必要があるインメモリデータベースでは、単にデータを保存したり、ホストCPUを使用して圧縮や暗号化を行う代わりに、FPGAベースのシステムがこれらのデータを処理します。FPGAベースのシステムは、このようなデータのスナップショットを処理して、大容量のNVMeベースのストレージ・アレイに永久保存することができます。このような運用では、MPSoCはユーザーデータに対してより複雑な処理を行うのに特に適しています。
最後に、IoT空間では、集約が行われるIoTゲートウェイでのデータのフィルタリングや前処理、また受信後のデータに対する暗号化のニーズがあり、FPGAはリアルタイムでデータのストリームを暗号化や圧縮などのビット演算で処理し、250S+を使ってデータをオンボードで離れて保存するか、ケーブル付きの250S+や250-SoCを使って入力帯域でストレージバックプレーンに渡します。FPGAは、ブロックチェーン計算から選ばれるプラットフォームでもあります。ブロックチェーン技術は、IoTゲートウェイに差別化をもたらし、IoTデバイスのユーザープライバシー設定を維持するための適応的で安全な方法を提供します17。
BittWare は、20 年以上にわたって、業界の専門家が FPGA をインフラに導入してワークロードを設計、開発、最適化するのを支援してきました。この間、BittWare Compute and Network ソリューションは、HPC、金融、ゲノム、組み込みコンピューティングなど様々な業界のお客様に競争力を提供してきました。BittWare は、ハードウェア、ソフトウェア、システム設計の専門知識を組み合わせ、自社製品で FPGA 技術のメリットを最大化することを目指すお客様をご案内しています。
250-accelerator シリーズでは、BittWare がザイリンクスUltraScale+ デバイスと PCIe フォームファクターを選択し、ストレージインフラストラクチャアーキテクトに完全なソリューションを提供しています。これらのアクセラレータは、ザイリンクスデバイスのプログラマブルロジックをインフラストラクチャーネットワークに直接接続し、前世代の100GbEおよびPCIe 3.0高速インターフェイスを通じてPCIeファブリックに接続します。さらに、BittWare の親会社であるモレックスの能力を利用し、250 シリーズは既存のハードウェアを接続する高い柔軟性を提供します。モレックスは、超高速低損失ケーブルと相互接続ソリューションの業界リーダーです。
NVMeは、これまでも、そして今も、急速なスピードでストレージ業界を変革しています。この新しい高スループット・ストレージ・テクノロジーは、ITインフラストラクチャに柔軟なストレージ・ソリューションを提供します。NVMeは、前世代のストレージと比較して、データの書き込みと読み取りの帯域幅が優れているだけでなく、既存のデータセンターの現在のPCIeとネットワークファブリックを活用することができます。NVMeの普及に伴い、業界のイノベーターはNVMeをサポートする新製品を発表しています。基本的なデータセンター機器はすべてNVMeをサポートするように更新されており、NVMeストレージバックプレーンは今や新しい標準となっています。
NVMe用のFPGAベースの製品は、コンピュートとストレージをハードウェア・レベルで融合させ、より高いアプリケーション性能に到達させることができます。FPGAでは、再構成可能なロジックの処理が、高スループットと低レイテンシのパイプを通じてストレージに直接接続されます。このような特性から、データはFPGAの中を流れ、リアルタイムで処理されることができます。さらに、FPGAの処理を利用することで、CPUコアはプロセッサでしか実行できない他のタスクの実行に自由に使えるようになる。MPSoCでは、システムにさらなる機能を持たせ、高速データ処理と制御をデバイス上で組み合わせ、自律的に動作させることができる可能性があります。
BittWare FPGAとMPSoCベースのストレージ製品は、実際のアプリケーションのニーズをターゲットとし、ITインフラ管理者の課題を解決するために設計されています。BittWare 、250製品シリーズで生産へのパスを提供します。
BittWare WebinarArkville Intel® Agilex™ FPGA を使用した PCIe Gen4 Data Mover Webinar Atomic Rules 社のArkville IP は、最近更新され、Intel をサポートしました。Agilex
PCIe FPGA Card XUP-VV4UltraScale+ FPGA PCIe Board with VU13P 4x 100GbE and up to 512GB DDR4 価格の見積もりは必要ですか?見積もりフォームへジャンプ
ホワイトペーパーBittWare's Loopback App Note and Example OverviewBittWare's Loopback example は、いくつかのことを実証しています:でザイ リ ンクス CMAC を完全に使用す る 方法を示 し ます。
インテル® oneAPI™ 高レベル FPGA 開発メニュー oneAPI アクセラレーター・カードの評価 ASP 詳細情報 お問い合わせ/購入先 oneAPI はあなたに適していますか?すでにご存知かもしれませんが
45 South Main Street, Concord, NH 03301|コンコード、ニューハンプシャー州 603-406-6200 | 連絡先