
AI金融取引モデルのMAUアクセラレータ「Myrtle.ai」。
AI金融取引モデル用アクセラレータ 超低遅延・高スループット機械学習推論 金融の様々なアプリケーションに適しています。
オンデマンドで配信中:
このウェビナーでは、Achronix® とBittware が、高性能アプリケーションにおける PCIe ベースの FPGA アクセラレータ・カードの利用動向について説明します。このセミナーでは、BittWare と Achronix が共同で開発した新しい S7t-VG6 VectorPath™ アクセラレーター・カードについて説明します。S7t-VG6 VectorPathアクセラレーター・カードは、先進の7nm TSMCプロセス・テクノロジーと、400Gイーサネット、GDDR6メモリー、フレキシブルなOCulink 拡張ポートなどの高度な接続機能を活用した初のカードです。ウェビナーに参加すれば、PCIeアクセラレータ・カードの採用を促進する市場動向を理解し、この技術をアプリケーションでどのように活用できるかを確認し、BittWare とAchronixが提供する新しい高性能VectorPathアクセラレータ・カードの詳細を知ることができます。
はじめに - マーカス
ウェビナーへようこそ-ご参加ありがとうございます。
今日のトピックはFPGAアクセラレーターカード、特に新しいVectorPath S7t-VG6についてです。BittWare のマーカス・ウェドルです。
プレゼンテーション本編中、質問を思いついたら、質問コントロールパネルで質問してください。プレゼン中にチャットで答えてくれるスタッフもいます。もちろん、最後に行われるQ&Aセッションで、プレゼンターと一緒にライブでお答えすることもできます。それでは始めましょう。
最初のプレゼンターは、アクロニクスのセールス&マーケティング担当副社長、スティーブ・メンザー氏です。スティーブはFPGA業界で25年の経験を持ち、現在はもちろんインテルの傘下であるAltera 、さまざまな役職を歴任してきた。
スティーブには、BittWare のマーケティング担当副社長であり、FPGAで数十年の経験を持つクレイグ・ペトリが加わる。クレイグは、2018年にBittWare ブランドと合併したNallatech社からスタートしました。
では、本題のプレゼンテーションをスティーブに引き継ぎます。
スティーブ・メンザー - アクロニクスの紹介
マーカス、ありがとう。このウェビナーで、最近発表されたVectorPath S7t-VG6アクセラレーター・カードについてお話しできることをうれしく思います。カードの詳細について説明し、最後に質問を受け付けます。最初に、この製品を一緒に開発している両社について知っていただくための紹介をします。
アクロニクス当社はハイエンドFPGAと、FPGAをサポートするクラス最高のツールに特化した会社です。当社がユニークなのは、ハイエンドのスタンドアロンFPGA製品に注力している唯一のFPGA企業であると同時に、ASICSやSLCに統合可能なエンベデッドFPGA IP技術を販売している点です。当社は、Speedster7t と呼ばれる最新の製品ファミリーに注力しています。これは、高帯域幅とAIアプリケーションに焦点を当てた製品ファミリです。
クレイグ・ペトリ入門BittWare
スティーブ ありがとうございます。BittWare BittWare をご存じない方のためにご説明しますと、当社はモレックス・グループの一員で、コンピュート、ネットワーク、ストレージ、センサー処理などのアプリケーション向けにFPGAベースアクセラレーション に注力しています。これらのプログラマブルFPGA製品は、アプリケーションの性能とエネルギー効率を向上させるとともに、顧客の総所有コストを削減します。
BittWare 当社は30年にわたり、先進的なFPGAアクセラレータ製品の設計と展開を成功させてきた実績があります。モレックス・グループの一員である当社は、エンタープライズ・クラスの認定、検証、ライフサイクル、サポート要件に対応できる唯一のFPGAカード・サプライヤです。Achronix社とのコラボレーションは、BittWare にとって非常にエキサイティングなことです。
スティーブ・メンソール
データ・アクセラレータの必要性を促進する多様なワークロード (02:57)
カードの詳細に入る前に、その背景について少し話しておきたい。ハードウェア・アクセラレーターに関する予測は数多く出ている。シリコン・ベースのハードウェア・アクセラレーターは、早ければ2023年までに200億ドルを超える規模になると予測されている。その根本的な理由は、Xeonプロセッサーをベースにしたサーバー・アレイを使うという従来の方法では、必要なパフォーマンスやエネルギー要件に対して、特定のワークロード問題に十分に対処できないからです。
それについて少し詳しく説明します。アプリケーション・セグメントをコンピュート、ネットワーキング、ストレージ、センサー処理に分けると、一番下に示したのは、データに対して行わなければならない様々なワークロードの多くです。つまり、歴史的には、データは最終的にA地点からB地点に移動しなければならないのです。
今、私たちは、データを移動する前にそのデータに対して行わなければならない作業がある領域にいる。簡単な例としては、圧縮や暗号化がある。もちろん、他の例としては、AI/MLの非常に急成長している市場セグメントがあります。実際、この下にAI/ML指向のさまざまなワークロードをハイライトして示しています。しかし、このように多くのワークロードがある中で、これらの異なるワークロードすべてに対応する技術を1つのハード機能として、あるいはASIC機能として開発することは非常に難しいということがお分かりいただけると思います。
結局のところ、もしそのような方法があれば、この問題を解決する修正プログラムやチップセットがあるはずだ。しかし、やはりCPUの観点からは非効率的です。そのため、GPUかFPGAのいずれかがプログラム可能なソリューションであることがわかります。特にFPGAの利点のひとつは、アクセラレーション 、桁違いの性能を生み出す能力があり、さまざまなタイプのワークロードに対応できることです。
クレイグ・ペトリ
PCIeアクセラレーターカードの市場需要 (05:06)
このスライドの目的は、私たちが市場で見ているトレンドを強調し、アchronix社とともに、私たちがどのようにそれらに対処する手助けをしているかを説明することです。過去5年から10年の間に、私たちはNvidiaのGP-GPU技術の成功を目の当たりにしてきました。これによって態度が変わり、アプリケーションのパフォーマンスを向上させる手段としてアクセラレーション 。
より多くの顧客が、それぞれ長所と短所を持つ異なるテクノロジーをミックスしたヘテロジニアスアーキテクチャを使用しています。GP-GPUの利回りが低下するにつれて、顧客は性能向上とエネルギー効率の次の波がどこから来るかを探しています。
市場では過去 3 年間、注目度の高い FPGA のサクセスストーリーがいくつかあった。例えば、マイクロソフトのカタパルト・プログラムでは、Altera(現在はインテル)ARRIA 10 FPGA を使用して Bing 検索エンジンを高速化した。マイクロソフトはFPGAを使用したアプリケーションへの投資を続けており、現在は永続的なAIニューラルネットワークを実行するBrainwaveプログラムにインテルSTRATIX 10 FPGAを使用している。
最近では、アマゾンのAWS F1クラウドインスタンスがザイリンクスUltraScale+ FPGAで増強された。これらはすべて、ハイパースケールの顧客が1つか2つのアプリケーション要件を解決するための特別な実装を作成するために、多大な時間、資金、人的リソースを投資する、チップダウン設計と呼ばれるものの好例である。FPGAが典型的な技術採用曲線を描くにつれ、消費モデルも変化している。ティア2のハイパースケールおよびエンタープライズクラスの顧客は、解決すべきアプリケーションの問題が非常に広範で、チップダウンモデルへの投資を正当化できないため、異なるセットを持っています。
彼らは、既製品やサーバー・レベルのカードを購入したいと考えている。このため、Dell、HPE、IBMなどのサーバー・ベンダーが、人気の高いサーバー・プラットフォームでFPGAカードを販売している。FPGAの主要ベンダーであるIntelとXilinxもこの市場動向を認識しており、それぞれPACとALVEOシリーズというFPGA PCIeアクセラレータ・カードを発売している。
データセンターのシステムとビジネス要件 (07:30)
次の数枚のスライドでは、S7tカードと設計ツールが、ターゲット顧客から見られる詳細な技術的要件のいくつかにどのように対処するのに役立つかを説明します。私たちはまた、顧客が経験するビジネス要件の多くに確実に対応しようとしています。彼らは、総所有コストを削減するために、エネルギー効率を改善しなければならないという大きなプレッシャーにさらされています。
AchronixSpeedster7t FPGA の再構成可能な性質により、お客様は ASIC のような性能を実現しながら、新しいアプリケーション要件に迅速に対応することができます。Achronix S7t FPGA をエンタープライズクラスの既製の PCIe カードまたはサーバー・プラットフォームとして提供できるため、お客様はアプリケーションを実証し、迅速かつコスト効率よく拡張することができます。お客様が概念実証に使用するハードウェアは、すぐに拡張できる生産準備の整ったハードウェアでもあります。これらすべての要素が相まって、市場投入までの時間が短縮され、リスクが軽減されます。
スティーブ・メンソール
VectorPathアクセラレーターカードの紹介 (08:29)
さて、ここからはVectorPathアクセラレーター・カードの詳細を見ていこう。まず、カードのフォームファクターだが、これはフルハイトでダブルワイドのカードだ。これはGPUサイズのカードと同じフォームファクターだ。非常に重要なのは、パッシブ、アクティブ、液冷など複数の冷却オプションがあることだ。また、全体的な品質はエンタープライズクラスです。
クレイグ・ペトリ
このコラボレーションにおける私たちの目標は、エンタープライズクラスの製品を提供することであり、それは明らかに高品質のハードウェアを意味します。しかし、それは設計ツールやユーティリティも意味します。私たちがAchronixと提供するバンドルには、ハードウェアだけでなく、Achronix ACE設計ツールとBittWare のツールキットも含まれています。ツールキットには、30年にわたるFPGAカードの経験と機能が活用されています。ツールキットのヘッドラインには、高度なボード管理コントローラ(BMC) が含まれ、アプリケーション負荷の下でカードの健全性を監視できます。例えば、消費電力、電圧、電流、温度のモニタリング、さらに顧客にとって重要なその他のさまざまなパラメータなどである。このツールキットは、ほとんどの顧客が使用しているLinuxの最新バージョンでサポートされています。しかし、レガシー・アプリケーションが複雑なお客様のために、オプションでWindowsもサポートしています。広範なAPI PCIeドライバセットが利用可能で、複数のアプリケーション・サンプル設計があり、主要なFPGAペリフェラル、PCI Express、メモリ、ネットワーク・ポートのそれぞれでデータを移動する方法を示しています。これらはソースコードとともに提供されます。最後に、当社の技術サポートと保証サービスの基本である診断セルフテストがあります。このテストは、当社の製造テスト体制の一部であり、お客様がアプリケーションを開始する前に、カードが輸送、取り扱い、設置に耐えることを確認するために使用されます。これは、デバッグに有用なゴールデン・イメージであり、すべての機能が最大限のパフォーマンスを発揮することを確認します。
高速データ・インターフェース (10:35)
このスライドの目的は、Speedster7t FPGA アクセラレータ・カードの主要機能を要約することである。私たちは、Speedster7t のデバイス機能とIPが、カードとサーバー・レベルで顧客に公開されるように努めました。まずPCI Express接続だが、これは16レーンのフルレーンである。カードは当初、PCI Express Gen3をサポートする予定です。しかし、このカードはGen4もサポートするように設計されています。私たちの目標は、Gen4を認定し、時間をかけて製品仕様をアップグレードすることです。AchronixSpeedster7t FPGAには、16レーンのPCI Express Gen5をサポートするハードIPが搭載されています。時期が来れば、カードのシグナル・インテグリティを調べ、互換性を確保するために必要な微調整を行います。
Speedster7t FPGAには、マルチ・ライン・レートのSERDES、MAC、FEC IPが豊富に搭載されており、毎秒1~400ギガビットをサポートします。当社は、BittWareの親会社であるモレックスの技術を活用し、QSFP 56 と QSFP DD(2 倍密度を意味する)の 2 種類のネットワーク・ケージを設計しました。QSFP 56は1 x 200ギガビット・イーサネット・ポートである。QSFP DDは1 x 400ギガビットイーサネットポートです。どちらのネットワーク・ポートも、モレックスのブレイクアウト・ケーブルを使用することで、10、25、40、50ギガビット・イーサネット接続の倍数に分割することができます。
メモリー・インターフェイス (12:02)
このアクセラレーター・カードのその他の主な特徴には、革新的なメモリー・アーキテクチャがある。高価なHBM2統合メモリをFPGAに使用する代わりに、AchronixはGDDR6ハードIPを搭載した。BittWare カードは、8ギガバイトの容量を持つ8つの独立バンクをサポートしている。これにより、毎秒4テラビットの外部メモリ帯域幅が生成され、HBM2を使用して達成される性能に匹敵しますが、コストはかかりません。GDDR6メモリはGPUで広く使用されており、マルチソースである。このアーキテクチャーにより、BittWare 、大容量アプリケーション向けにカードをカスタマイズすることができます。顧客はこう言うかもしれない、
「私のアプリケーションではメモリバンクの半分しか使っていません。価格と消費電力を削減するために、バンクのうち4つを使わないか?"
HBM2対応デバイスを使用する場合、別のFPGAと新しいPCBが必要になる可能性がありますが、これは簡単なオプションです。この場合、単純にデポパレーションを行い、コストを削減し、顧客の費用を節約することができます。また、このレベルのアプリケーション・バッファリングを必要とする顧客のために、DDR4のシングルバンクをバッファとして搭載し、キャッシュ・レベルのメモリ・オプションも用意しました。
クロックと拡張インターフェイス (13:15)
このスライドでは、アプリケーションを効率的に実行するために必要な、より繊細だが非常に重要な機能のいくつかを要約しています。BittWare 、この製品が1枚のカードでコンピュート、ネットワーク、ストレージ、センサー処理ワークロードのさまざまな要件に対応できるよう、30年にわたる経験を総動員しています。市場に出回っている他のFPGAカードには、こうした機能はあまり見られません。
まず、フロントパネル左側のSMAコネクターです。これらは1PPSや10メガヘルツなどのクロック入力で、タイミングが重要なアプリケーションで複数のカードを同期させることができます。これがないと、ネットワーク対応アプリケーションの拡張が極めて困難になる。カードの右側には、汎用デジタルIOヘッダーがある。これは比較的ローテクなコネクターで、Speedster7t FPGAから8本のシングルエンド・ピンを電圧バッファーに通し、1.2ボルトから3.3ボルトに変換する。このヘッダーは、単純なデジタル・トリガーや制御ループを必要とするレガシー・システムに新しいアクセラレーション テクノロジーを統合する場合に非常に重要です。
拡張インターフェースの使用例 (14:30)
OCuLink OCuLink は Optical Copper Link の略で、PCI Express 相互接続システムです。S7tアクセラレータ・カードのこのポートには、主に4つの使用例があります。
1つ目は、FPGAがNVMEフラッシュ・アレイと直接インターフェイスすることです。これにより、ネットワーク・ポート経由で取り込んだデータを前処理してNVMEストレージに直接保存したり、FPGAで取り出してデータベース(アクセラレーション )やビッグデータ・アプリケーションの一部として処理したりできる。BittWare 、FPGAアプリケーションを複数のデバイスにまたがって拡張したいというニーズがあります。PCIeが優れているのと同様に、ホスト・インターフェイス、チップセット、ドライバ、オペレーティング・システムを介して拡張しようとすると、必然的にパフォーマンスが低下し、システムレベルのジッタが増加します。アプリケーション拡張ポートを単純なSERDES、すなわち非PCIeプロトコルとして使用することで、モレックスが提供するシンプルなケーブル・アセンブリを介して、Speedster7t デバイスを直接相互接続することができます。
顧客は、デイジーチェーン、リング、メッシュ・トポロジーなど、アプリケーションに最適なトポロジーを使用して相互接続できます。このテクニックを使うことで、顧客は低レイテンシー、高帯域幅、そして最も重要なこととして、システム内のFPGA間の決定論的インターフェイスを手に入れることができる。3つ目の使用例は、このカードがIOリッチであるのと同様に、ネットワーク接続性という点でもう少し多くを望む顧客が常に存在するということです。そのような顧客に対応するため、アダプタを使用することで、フロントパネルから拡張ポートを介してSpeedster7t FPGA にさらに多くのネットワーク・ポートを追加することができます。
最後の使用例は、前のスライドのGPIOヘッダーの場合と同様、プロトコルにとらわれないOCuLink 拡張ポートを使って、古いシステムに新しいテクノロジーを統合することができる。
スティーブ・メンソール
Speedster7t 2Dネットワークオンチップ(NoC) (16:30)
それでは、スピードスターS7tの特徴についてお話しします。NoC(ネットワーク・オン・チップ)は2次元実装です。2次元実装です。NoCの詳細をすべて説明するつもりはありませんが、基本的にNoCは非常に高い帯域幅を持ち、各横列と縦列で毎秒512ギガビット、イーサネット、PCI Express、GDDR6ポート、DDR4などの高速インターフェイスに接続できます。
NoCとの通信には複数の異なるモードがある。最も一般的なものはAXIインターフェイスで、インターフェイスの仕組みを理解する設計エンジニアにとっては非常に標準的なものです。 このような接続ポイントは、水平方向の行と垂直方向の列が互いに交差する任意のポイントです。NAPまたはNoCアクセス・ポイントと呼ばれるものがあります。つまり、ネットワーク・オン・チップに接続することも、これらのポイントのいずれかで接続を解除することもできるのです。これは非常に強力な機能で、NoCがFPGAファブリック全体に分散されているため、実世界での実装に適しています。
Speedster7t NoC:新しい設計パラダイム (17:55)
ここで例を挙げよう。ここに示したのは、2つの異なるアクセラレーター機能、アクセラレーター1とアクセラレーター2を作成するFPGAの漫画です。異なるGDDR6ポートが見えます。つまり、これらのポートのいずれかに接続したい場合、仮に2つのポートがあるとすると、それを実現するための機能を構築しなければなりません。結局のところ、ユーザーとしては、アクセラレーター機能にしか関心がない。それ以外のことは、FPGAなので、外部と通信するための機能をすべて自分で設計しなければなりません。クリックして進むと、必要な機能が表示されます。まず、GDDR6ポートと通信するため、外部からのクロッキングがあり、それをFPGA内部のクロッキングと同期させる必要があります。そこで、FIFOのような標準的な構造を使います。これはかなり簡単です。
さらに複雑なのは、異なるアクセラレーターが異なるメモリの両方と話す必要があるため、共有メモリ空間が存在することだ。アドレッシング、デコード、ルーティングを行う制御メカニズム、つまりスイッチ機能が必要だ。2つのアクセラレーターが同時に同じメモリ・ロケーションに接続しないように、コントロールとバック・プレッシャーが必要だ。そして、そのすべてを逆方向にも行わなければならない。
もう一度クリックしてみると、ここで赤くハイライトされている部分は、先ほど申し上げたように、顧客にとっては何の価値もないことがわかる。必要悪なのだ。
これにはいくつかの課題があります。ひとつは、下の方にあるように、この赤い部分が2次関数的に成長することを強調しています。スイッチ機能に新しいポートを追加するたびに、それが別のメモリー・ポートであろうと、高速インターフェースであろうと、別のアクセラレーターであろうと、この領域は非常に速い速度で成長し、この赤色の機能、言い換えれば、外部との接続性と、アクセラレーターという本来集中したい機能とを比較すると、回路が非常に多くなってしまいます。
おそらくもっと重要なのは、設計とタイミング閉鎖が非常に難しくなるということです。現実には、非常に高性能なインターフェイスを使用する場合、場所と経路の観点から何が起こるかというと、回路は接続性のあるポートに引っ張られようとします。つまり、アクセラレーターとさまざまなポートの間を引き伸ばすことになり、タイミングを閉じるのが非常に難しくなります。
Speedster7t はソフトウエアに優しいハードウエアである (20:42)
スピードスター7t FPGAで異なるのは、水平または垂直カラムが互いに交差するすべてのポイントに、FPGAファブリック全体に分散配置されたNoCアクセス・ポイント(NAP)を備えた2D NoCを採用していることです。つまり、エンジニアがすべきことは、アクセラレーターRTLを設計し、どんな専門知識を持っていても、AXI接続を行うだけです。つまり、NAPのインスタンスを作成し、それを接続するのです。そこから、ACEと呼ばれるAchronixのソフトウェア・ツールが、アクセラレータと各種メモリ・ポート、またはイーサネットやPCI Expressなどの各種高速ポート間のすべてのルーティングを行います。これは非常に重要なことです。なぜなら、エコシステムはこの製品にとって非常に重要であり、さまざまなタイプのアクセラレーターという点で、前にお話ししたワークロードを作成するために構築されるさまざまなタイプのソリューションが存在するからです。
この環境はエンジニアにとって設計が非常に容易であるため、専門分野や提供するIPの種類を持つさまざまなエコシステム企業がエンド・ツー・エンドのソリューションを作成できるという意味で、エコシステムが成功することを意味する。それは暗号化であったり、アクセラレーション 、あるいはあらゆるタイプのAI/MLアプリケーションであったりする。IPプロバイダーはNAPをインスタンス化するだけで、外の世界と話をすることができるようになる。我々は現在、かなり大規模なエコシステムを持っている。これは、設計者にとってもエコシステムにとっても、エンド・ソリューション製品用のIPを構築するのが非常に簡単な環境だからです。
Speedster7t コンピュート集約型のAI/MLアプリケーションに最適化(22:47)
もうひとつお話ししたいのは、Speedster 7tデバイスの内部にはMLP(機械学習プロセッサー)が搭載されているということです。これは従来、標準的なFPGAではDSPブロックと呼ばれていたものですが、AI/MLアプリケーション専用に最適化されています。機能的な説明をすべてするつもりはないが、そのハイライトをいくつか紹介したい。
まず、デバイス全体に分散されているという点で、この7tカードでは4万以上のINT8 MACオペレーションが可能で、750メガヘルツで動作します。これは、毎秒80テラ・オペレーションを超える機能に相当します。また、よく引き合いに出されるベンチマークにRESNET 50がありますが、このベンチマークでは毎秒8600枚の画像が表示されます。
それ以外はAI/ML、主にトレーニング分野に注力してきたGPUについてコメントしたい。AI/MLの課題の1つは、GPUにはキャッシュ構造を持つさまざまなエンジンがあり、CPU上のシーケンシャルな実装とほぼ同じように設計されているため、メモリ配信やデータ転送の課題に直面し、実際の計算エンジンが利用されるのは時間の10~20%程度に過ぎないということです。
GPUが1秒あたり130テラ・オペレーションと言われているのに対し、例えば1秒あたりの画像を測定した場合、実際の結果は1秒あたり15テラ・オペレーションから20テラ・オペレーションに近くなります。一方、Speedster7t GDDR6として実装された高帯域幅メモリとネットワーク・オン・チップ、さらに高度に最適化された機械学習プロセッサー・ブロックにより、AI/MLの実装において最大80%の効率を実現できることが分かっています。
クレイグ・ペトリ
パフォーマンスとサポート(24:53)
以前ウェビナーで述べたように、FPGAが技術採用曲線に乗るにつれ、消費モデルがチップダウン設計からカード、統合サーバープラットフォームへと変化していることを説明した。
サーバーレベルでのご購入をご希望のお客様へ。S7tカードは、BittWareのTeraBox製品群の一部として利用可能です。ここ数年の間に、BittWare 、今年初めにリニューアルしたTeraBox製品群からのデザイン獲得と収益が増加しています。FPGAカードは、あらかじめ統合され、テスト済みのDellまたはHPEシステムとして顧客に納品され、機械的な部分と熱的な部分はすでに把握されており、さらにサーバーとFPGAカードの両方をカバーする包括的な保証が提供されます。
オペレーティング・システム、BittWare ツールキット、Achronix ACE デザイン・ツールはすべてプリロードされており、すぐに使用できます。お客様は電源を入れ、ログインし、診断テストを実行して、すべてが正常であることを確認するだけです。
TeraBoxサーバープラットフォームの提供 (25:55)
TeraBox製品群は、2つの特定のタイプの顧客に対応するために作られた:
1つ目は、顧客の納期や上司のデモのためにコンセプトの実証を準備しようとしている開発者です。そのため、Teraboxシリーズは、顧客が1つの品目に対して1回の発注を行い、すべてを1つのパッケージで納品することを可能にします。
概念実証段階が完了すると、展開段階で私たちが次に出会うのはプログラム・マネージャーやITリーダーといった顧客タイプになる傾向があります。これらの顧客は通常、FPGA技術の詳細には疎く、代わりにアプリケーションの展開と管理に多くの関心を寄せています。彼らは、サービスレベル契約、保証、テクニカルサポート、現場で製品を監視するためのユーティリティ、アップグレードとメンテナンスのスケジュールについて理解したいと考えています。モレックス・グループの一員として、BittWare はグローバルなサプライ・チェーンとインフラを有しており、これを独自に活用することができる。さらに、BittWare 、DellとHPEのOEMプログラムにも参加している。これは、顧客が希望すれば、現在の契約に基づいてデルまたはHPEから直接TeraBoxを購入できることを意味する。
スティーブ・メンソール
入手可能性と価格(27:12)
VectorPath S7tボードは、2020年第2四半期初頭に発売される予定である。しかしその前に、Achronix ACE設計ツールを使ってFPGA機能の設計を始めることができる。これらのツールは現在入手可能である。そのため、ソフトウェアの評価や、カードの発売に向けて設計の準備を始めることができる。
まとめ(27:47)
では、簡単なまとめをしてから質問に移りたいと思います。
まず第一に、非常に成長率の高い市場であるということです。アクセラレーター・カードを使うというアイデアはGPUで実証され、データセンター・アプリケーションに応用されている。
AchronixとBittWare の協力はエキサイティングなパートナーシップであり、ユニークな機能を提供している。このカードにはSpeedster7t FPGAが搭載されており、MLPだけでなくネットワーク・オン・チップについても話をしました。そしてクレイグは、BittWareの長年にわたるこの技術提供の経験から生まれた、カード上の実に興味深い革新的な機能について話しました。しかし、結局のところ、このコラボレーションとソリューションは、エンタープライズ・クラスの完全なソリューションを提供することに重点を置いています。
質疑応答セクション(28:43)
マーカス・ウェドル
よし。マーカスです。パネリストの皆さんに、私の声がちゃんと聞こえているかどうか、確認させてください。
[スティーブとクレイグは確認する]。
最初の質問は、市場に出回っているHBM2のFPGAカードについてです:S7tはGDDR6を搭載していますが、HBM2も市場に出回っています。S7tがGDDR6であることは明らかですが、HBM2も市場に出回っています。BittWare 。S7tはそれらと比較できますか?
それで、もしよければスティーブにも話してもらえないかな。
クレイグ・ペトリ
では、実際にこの質問から始めさせてください。 カードの質問としては、いい質問ですね。
S7t カードを差別化することは、市場に投入していく上で非常に重要なことだと思いますし、それが製品のウェブページやこれまでお伝えしてきた資料、そしてウェビナーでも伝わればと思っています。HBM2メモリーを搭載した他のベンダーのFPGAカードと比較して、ウェビナーでいくつかの重要な特徴を強調することで、私たちが差別化を図っていることを示すことができたと思います。この特定のカードは、非常にバランスの取れたアーキテクチャで、さまざまなタイプのワークロードに適していると思います。ですから、ウェビナーで挙げたコンピュート、ネットワーク、ストレージ、センサー処理の例をカバーしようとしています。そのためには、豊富なIOの組み合わせが必要です。クロック入力、デジタル・トリガー、拡張ポートなどです。S7tカードには、このような機能が搭載されていますが、市場に出回っている他のHBM2カードには、このような機能はほとんどありません。まとめると、私たちは非常に高いレベルの柔軟性を顧客に提供することができるということです。
しかし、他のカードと差別化するために、いくつか強調したい点がある。
AchronixSpeedster7t デバイス自体には、カードやシステム・レベルで公開しようとしているユニークな機能があります。これには、QSFP 56経由の非常に高いラインレートのイーサネット・ポートや、QSFP DD(Double Density)ネットワーク・ポートなどが含まれます。そしてもちろん、これらがHBM2と同じ帯域幅で非常に高い帯域幅を持つGDDR6やNoCに接続されれば、現在市場では出荷されていない非常に興味深いアーキテクチャになります。
この製品を来年の第2四半期初めに出荷するときには、市場の他のカードよりも先行していると思います。さらに差別化を図り、最終的にはお客様の生活をより快適にするために、BittWare 、30年にわたる経験とIPを蓄積してきました。LinuxとWindowsの両方に対応したドライバとAPIのサポート、内蔵診断セルフテスト、ソースコードの設計例など、さまざまな形で提供しています。
そして最後に、このテクノロジーをカード・レベルだけでなく、サーバー・レベルでも使用したいとお考えのお客様には、もちろんTeraBoxシリーズをご用意しています。モレックスのグローバル・サプライ・チェーンを通じてこの種の製品を販売、販売、サポートできることは、BittWare 、私たちが持つ素晴らしい利点です。私たちは、そのすべてをカードのバリュー・プロポジションに注ぎ込み、他社製品との差別化を図りました。質問の答えになれば幸いです。
マーカス・ウェドル(32分50秒)
ありがとう、クレイグ。今回はスティーブのために1つ持ってきたよ。そのソフトウェアはHLSツールを提供していますか?なければ、Mentor Catapultを使うことはできますか?
スティーブ・メンソール
ええ、いい質問ですね。OpenCLに関しては、OpenCLをサポートする計画はありませんが、HLSに関しては計画があります。我々はメンター社のカタパルトと協業しており、カタパルト製品は我々の前世代ファミリーをサポートしています。また、我々はメンター社と協業し、カタパルトが我々のSpeedster7t ファミリーをサポートする予定です。それは将来的なことで、それが可能になったときに発表する予定です。
マーカス・ウェドル
素晴らしい。ありがとう。質問がたくさんあります。みなさんが質問を続けたいと思う限り、私たちは質問を続けます。素晴らしい質問にお答えする機会はたくさんありますので、どんどんお寄せください。
そこで次の質問は、おそらくスティーブへの再質問になると思いますが、この新しいFPGAのfMAXはどれくらいですか?
スティーブ・メンソール
FMAXはFPGAにとって常に興味深い問題だ。FPGAのクロックは750MHzまでバックアップされている。ほとんどのFPGAでは、実際のFMAXはタイム・エンクロージャの一部になります。そのため、デザインの複雑さやロジックのレベルなどによって異なります。Speedster7t 、他のFPGAではタイミング・クロージャの課題となる通常の混雑を大幅に軽減するNoCについて説明しましたが、これにはユニークな点があります。つまり、設計次第ということです。FPGAの94%を使用する2Dコンボリューションの設計例がありますが、750MHz前後で動作しています。750MHzが最大ですが、実際の実装次第です。
マーカス・ウェドル
わかりました。カードの価格について質問があります。スライドにあったと思います。S7t単体の定価は500ドルです。クレイグ・ペトリさん、もう少し詳しく説明してください。
クレイグ・ペトリ
もちろんだ。はっきりさせておきたいのですが、低ボリュームの定価は7,500ドルです。これはバンドル価格です。カードだけではありません。カードはもちろんですが、Achronix ACE Design Toolsのライセンスも含まれています。また、包括的なBittWare ツールキットも含まれています。Linux用のドライバやAPIも含まれています。Windowsは定価以上のオプションです。ツールキットには、診断セルフテスト、ソースコードのサンプルデザイン、ボードマネージメントコントローラーなど、あらゆる良いものが含まれています。ですから、私たちは購入体験を非常にわかりやすくするよう努めました。ハードウェア、ファームウェア、ソフトウェア、ドライバー、API、ツールなど、使い始めるために必要なものがすべて揃っています。
また、多くのお客様は、このような新しい技術から始めて、製品で何が可能かを探っています。そのため、すべてが1つのバンドルに含まれていることを確認したいのです。隠れたコストがなく、別の場所からツールを購入したり、別の場所からハードウェアを購入したりする必要がない。そのため、私たちの顧客にとって体験がシンプルになることを期待しています。ボリュームという点では、ウェビナーで明らかになったことのひとつに、ボリューム・アプリケーション向けに製品をカスタマイズできるという事実があります。カスタマイズの程度はさまざまです。最も簡単なカスタマイズのひとつは、ボリューム・アプリケーションで使用しないコンポーネントを削除することです。この場合、明らかな利点は、顧客のためにユニットのコストを削減できることです。また、消費電力を削減し、お客様に最適化されたソリューションを提供することができます。すべての人が製品のすべての機能を必要とするわけではありません。私たちはそのことを認識しているので、単価をできる限り下げるために顧客に選択肢を提供する計画がある。
メカニカルな部分やプリント基板を変更するような大幅なカスタマイズが必要な場合は、それもオプションです。つまり、これは非常に柔軟性の高いモデルであり、アプリケーションを証明する1台から大量導入に至るまで、顧客に多くの選択肢を与えているのです。また、TeraBoxシリーズもそのひとつです。カードを扱うだけでなく、サーバー・レベルの要件にも対応し、ワンストップ・ショップで単価を可能な限り下げることができます。7,500ドルというスタート価格は、あくまで少量生産の場合です。数百台、数千台になれば、大幅に下げることができると考えています。
マーカス・ウェドル(38分33秒)
クレイグ、ありがとう。何人かの方から質問が来ていたのですが、発音はCシックスかシー・シー・アイ・エックスだと思いますが、CCIXだと思います。スティーブなら答えてくれるだろう。質問はPCIe Gen5のサポートに関するもので、いくつか詳細があります。CCIXのサポートはあるのか、コヒーレンシーのためにCXLをサポートする予定はあるのか。それで、もしよろしければ、それをお聞かせください。
スティーブ・メンソール
ああ、いい質問だ。このカードの特定のデバイスのPCI Expressは、CCIXやCXLをサポートしていません。アクロニクスの後続デバイスはCXLをサポートする予定です。
マーカス・ウェドル
オーケー。これはスティーブからの質問です。プロトタイピング・ソフトウェア・キットはどこでダウンロードできますか?
スティーブ・メンソール
そうだね。私たちの方法論はとても簡単です。アクロニクスのウェブサイトに行くと、登録フォームがあります。検索するか、ウェブページの一番下まで行くと、登録フォームがあります。そこからポータルサイトへのログイン情報とパスワードを取得するプロセスが始まります。ポータルが表示されたら、ソフトウェアをダウンロードして評価ライセンスを取得するためのすべての手順が説明されています。通常、評価ライセンスは約2ヶ月のオーダーでお渡ししています。このように、私たちのウェブサイトにはすべてが掲載されていますので、参考にしてください。
マーカス・ウェドル(40分13秒)
わかりました。クレイグについては、私たちのカードレベルですが、消費電力の数字はありますか?誰かが液冷について話していました。この方は、電源供給について、また電源コネクタの追加が必要かどうかについても興味があるようです。
クレイグ・ペトリ
なるほど、いい質問ですね。分かりやすくするために、BittWare とAchronixのウェブページにあるデータシートに写真があると思います。カードの機能の詳細を知りたい方は、こちらをご覧ください。カードには12ボルトの補助電源コネクターが2つあり、これはGP-GPUに搭載されているものと同じです。FPGAに詳しい人なら、カードの消費電力がアプリケーションに依存することを理解できるだろう。低速の小型設計を実行する場合、カードの消費電力は非常に低く、ほとんどの電力は定格75ワットのPCIeバスから供給される可能性が高い。
私たちは、お客様がSpeedsterの機能を活用し、カードを限界までプッシュし、先ほどスティーブが話してくれた750メガヘルツのFMAXの数値に到達しようとすることを期待しています。そのためには、ほとんどのお客様が、私たちがカードに組み込んだより高い電力能力を必要とされると思います。このカードの定格は225ワットで、高度なアプリケーションの典型的な消費電力としては高い部類に入ると思います。
そして、その間にあるものがすべてだ。すべての電源は、カード上のコネクターから供給されます。このカードはGPUサイズに設計されています。つまり、市場に出回っている1U、2U、4Uのサーバーと互換性があるということです。つまり、そこが我々の勝負どころなのです。BittWare 、最近の我々の経験では、顧客は製品の冷却方法について選択肢を求めています。
FPGAは、ワットあたりの性能から見ると非常にエネルギー効率が高いのですが、FPGAの電力密度は依然として増加しています。これは7ナノメートルのデバイスなので、エネルギー効率は非常に高いのですが、性能も非常に高いのです。この製品では、メカニカルな部分と熱的な部分に十分配慮しています。お客様の最終的な要求を満たすために、3つのオプションを用意しました。
標準品はパッシブ冷却ヒートシンクオプションになります。つまり、内蔵ファンはなく、すべてパッシブです。私たちの経験では、大量導入を目指す多くのお客様は、可動部品がなく、よりシンプルな設計であるパッシブ・ヒートシンクを好まれます。一般的に、これらのサーバー・プラットフォームには良好なエアフローがあるため、信頼性に関して非常に優れたMTVF値を得ることができます。ラボ環境で概念実証を行う顧客や、単に好みがある場合は、アクティブ・ファンシンクを備えた製品を使用することができます。この写真には写っていませんが、アクティブ・ファン・シンク・オプションがあり、BittWare ポートフォリオの他の高出力FPGAカードで導入に成功しています。これもカードを十分に冷却します。
さらに最近では、液冷も試しています。ここで言っているのは液浸液冷のことではなく、水や液体をカードに注入し、また排出する液冷のことです。FPGAカードでは比較的新しい分野だ。現時点では、このクラスの液冷カードは他のベンダーからは発売されていません。さて、幸運なことに、来週はデンバーでスーパーコンピューティングが開催される。この電話会議に参加している多くの人たちが、現地に行き、何が起きているのか見てくることだろう。BittWare 、Achronixのブースでは、カナダのCool ITという会社の液冷コールドプレート技術を搭載したS7tカードのメカニカルサンプルを展示しています。Cool ITは液冷のマーケット・リーダーで、DellやHPEなどのラック・テクノロジーにデザイン・インされており、今日、非常にハイパワーなGP-GPUカードの冷却に使われています。我々は彼らの技術を活用しており、サンプルを展示する予定だ。また、液冷を好む顧客にとっては、これは本当に良い選択肢になるだろう。私たちは、お客様に選択肢を提供しようとしており、この製品が市場で見られるすべての要求を満たすことを期待しています。
マーカス・ウェドル(45分40秒)
ありがとう、クレイグ。音声に問題がある人が何人かいるんだ。調べてみました。カットアウトはないですね?スティーブ クレイグの声は?
スティーブ・メンソール
ええ、できます。おいしいよ。
マーカス・ウェドル
ええ、残念ながら、個々のコネクションかもしれません。見てみよう。冷房に関連したものがいくつかあるんだ。よし、これを読もう。これはファンクションについてアクセラレーション 。アクセラレーション 関数のプロセスについて詳しく教えてください。これはRTLを使わなければならないのでしょうか、それともPythonのような高レベルのツールのサポートがあるのでしょうか?また、先ほどのスライドで使われていたResNETの実装について詳しく説明していただければ、機械学習の素晴らしい例になると思います。さらに、OpenCLがサポートされているかという質問もありました。HLSの話をしたときに、その答えがあったかどうか忘れてしまったのですが、もしよろしければすべてをまとめていただけないでしょうか。
スティーブ・メンソール
そうだね。オーケー。OpenCLから始めます。Achronixは、OpenCLを直接サポートする予定も、エコシステム・パートナーと協力する予定もありません。他のソリューションほど人気がないようです。我々はHLSソリューションに取り組んでいるが、まだ発表されたものはない。パートナー企業との詳細については、今年中に発表できると期待している。AIに関しては、例えばResNET50に関する質問ですが、こうした問題を解決する方法は複数あります。私たちは基本的に、RTLレベルか、あるいは最終的にネットワーク・レベルで作業できる低レベルのライブラリを提供します。私たちはこれらのライブラリを提供し、AI向けのさまざまなネットワーク実装をサポートする企業とさまざまな発表を行う予定です。
ResNET50の数値に関しては、Speedster7t,1500を最大にした場合、約8600フレーム/秒となり、これはFPGAだけでなく、半導体分野でも最大級の数値だと思います。このデザインはまだリリースされていません。このデザイン実装はまだリリースされていません。また、例えばYOLOv2やその他の実装についても、後日発表される予定です。
マーカス・ウェドル(48分25秒)
わかりました。カーネルバイパスについての質問です。HostessのCPUとFPGAの通信に利用できるドライバはありますか?それはクレイグに聞こう。
クレイグ・ペトリ
そうだ。ドライバによるカーネル・バイパスは当初サポートされていない。それは検討中だ。サポートしてほしい追加機能については、すでに顧客から良いフィードバックを得ている。ハードウェア的な機能もあれば、ファームウェアやソフトウェア的な機能もある。スピードスター・デバイスはまったく新しいアーキテクチャです。お客様がどのようにデータを移動させるかという点で、飛躍的な進歩を遂げることになります。そのため、ネットワークIPを専門とするこの分野のパートナー数社と話をし、最大限のパフォーマンスを得るために顧客に提供できるものを理解しています。ですから、これはまったく新しい技術であり、私たちの焦点は、お客さまが期待する主な機能を備えた標準製品を予定通りに出荷し、その後、時間をかけてアップグレードや改良を検討することです。
だから、意見や要求が満たされていないと感じている人は、それを我々にフィードバックして、その要求を今後の計画に反映させることを歓迎するし、奨励したい。
マーカス・ウェドル(49分53秒)
わかった。まだいくつか質問が残っていますので、それを取り上げます。私たちはすべての質問にある程度追いついています。まだ投稿していない質問があれば、ぜひ投稿してください。そのうちのひとつは、これからスティーブに投げかける質問なのですが、レイテンシーについてです。実は、レイテンシーについてはすでに文章がありますので、それをお送りしたいと思います。でもとにかく、今すぐ質問します。
HFT(高頻度取引)用のFPGAカードを探しています。御社のカードには、Mac、ADP、TCP IPコアのようなネットワークIPコアは搭載されていますか?UltraScale 、speed grade 3などの競合と比較して、レイテンシはどうですか?
そしてもうひとつ、同じような質問だと思うが、その答えは両方に当てはまるはずだ。
スティーブ・メンソール
もちろんだ。まず第一に、シリコンレベルでは、イーサネット用のマックはさまざまな形ですべてハード化されています。その上にTCP IPを載せたい場合は、ソフトIPになります。このようなエコシステムを提供するサードパーティ企業は数多くあり、Achronixのパートナーでもあります。Achronixにご連絡いただければ、そのような企業をご紹介します。レイテンシに関しては、データシートがあります。タイトルは「Speedster7t および Speedcore FPGA 製品におけるレイテンシの最小化」です。そして、その計算方法について説明しています。これは明らかに10ギガビット・イーサネットに焦点を当てたもので、16ビット・インターフェイスで実行するか、32ビット・インターフェイスで実行するかにかかわらず、詳細が記載されています。
Speedster7t;このデバイスのレイテンシは16ビットモードで20ナノ秒以上である。将来のデバイスはSerDes構造を追加し、ショートリーチのSerDesを追加し、それらの実装は16ビットインターフェースを提供するだろう。その場合、16ビット・インターフェイスは11秒半程度になるでしょう。そのため、大幅に低下します。しかし、これらは将来のSpeedster7t 。
マーカス・ウェドル
わかりました。以前の質問でも取り上げられたかもしれませんが、この質問はカードレベルのものです。
ユーザーガイド、アーキテクチャードキュメント、トライアルツールの入手プロセスはどうなっていますか?チップにはAchronixのツールがありますが、カード・レベルでは、クレイグさん、開発者向けサイトやそのようなものについて教えてください。
クレイグ・ペトリ
ええ、もちろんです。ですから、お客様にはかなり詳細なハードウェア情報を提供しています。それはさまざまな形で提供されていますが、現時点では製品のウェブページに良い情報が掲載されていると思います。BittWare にアクセスすると、Speedster7t デバイスがメインバナーで紹介されています。そこをクリックしてデータシートをダウンロードすれば、詳細がわかります。
弊社では、BittWare 製品の開発者向けサイトをご用意しております。そこで、製品の購入を検討されているお客様や、すでに製品を購入されたお客様は、開発者向けサイトにアクセスし、そこから製品のより詳細な情報をダウンロードして、購入を進めるかどうかの判断や、開発途中の場合、解決しようとしている問題の解決に必要なすべての詳細を得ることができます。
どんな情報をお探しですか?喜んでお答えしますよ。
マーカス・ウェドル(53分44秒)
わかったよ。これはスティーブにですが、チップに関してですね。特に、カードのセキュリティー機能はどうなっていますか?
スティーブ・メンソール
質問はビットストリームのセキュリティに関するものだと思いますが、MACsecやIPsecのようなデータ・セキュリティもあります。データ・セキュリティについては、将来の機器では検討されるでしょうが、私たちは何もハード化していません。ビットストリームのセキュリティには、さまざまなセキュリティ対策があり、認証の面では、クラス最高と同等かそれ以上だと考えています。検証認証、物理的認証、[ ]機能です。それに関する文書があります。ユーザーガイドだと思います。Achronixにご連絡いただければ、その詳細をお伝えできます。しかし、FPGAに組み込まれたすべてのセキュリティ対策について正確に説明します。
マーカス・ウェドル
いい指摘だった。私はチップ内のセキュリティについて考えていましたが、セキュリティのアプリケーションについても考えていました。ですから、その回答には感謝しています。ハードIPでサポートされているイーサネットのFECモードはどれですか?
スティーブ・メンソール
それはいい質問だし、私はその答えを知っているはずだ。文書化されています。私たちのドキュメンテーションの中にあります。
マーカス・ウェドル
ああ、それは公平だ。質問した人にまた連絡すればいい。もちろん、ドキュメントにも書いてあります。さて、質問はオンチップ・メモリ、モノリシック・メモリについてです。では、300メガビットを超える内蔵メモリを使って内部で構成できるモノリシック・メモリの最大サイズは?この数字が正確かどうかわかりませんが、スティーブさんにお答えいただければ。
スティーブ・メンソール
ええ、私たちが話しているのはスピードスター7tファミリーのことだと思います。このデバイスには7t 1500があり、BRAMとLRAMの形で190メガビットのメモリを搭載しています。BRAMのコンフィギュレーションは72Kビットで、LRAMは登録ファイルタイプの機能としてはかなり小さい。そして、これらはそれぞれ2Kビットである。
マーカス・ウェドル
ああ、いい指摘だ。申し訳ない。私が考えているのは既存のカードとそこに入っているものですが、この先、他のデバイスも出てくるでしょう。すみません、質問を見ていて、以前に質問されたものを確認しています。TensorFlowや他のMLフレームワークに関する質問もありました。それについては、すでにお答えいただいたと思います。
スティーブ・メンソール
それは素晴らしいと思う。これはスピードスター7tデバイスのフォーカス機能の1つです。もっと詳しく知りたい方は、Achronixに直接問い合わせることをお勧めします。また、TensorFlow Cafeやその他さまざまなネットワーク・タイプのアプリケーションがあります。Achronixにご連絡いただければ、お客様の要件を確認し、その要件にどのように対応するかをお伝えすることができます。
マーカス・ウェドル(57分27秒)
オーケー。まだ少なくとも2、3の質問がありますが、そろそろ終わりに近づいています。どなたか質問がある方は、もうそろそろ終わりに近づいています。質問はお早めに。クレイグ・ペトリーの場合近い将来、ロープロファイル・カードをリリースする予定はありますか?
クレイグ・ペトリ
ああ、いい質問だ。我々はGPUクラスのデバイスからスタートし、かなり多くのものを詰め込んでいる。他のフォーム・ファクターの必要性も認識しています。ハーフハイト、ハーフレングスはもちろん、特にSmartNICタイプのアプリケーションで人気があります。ですから、私たちはそのような製品にも注目していますし、現在、私たちのポートフォリオには他にもハーフハイト、ハーフレングスのカードがあります。そのため、これらの製品を提供できるような体制を整えています。
私たちが本当に考えようとしているのは、次にどの製品のバリエーションを出すかということです。さまざまな機能に対する多くの要望があり、アクロニクスはサイズも機能も異なる4種類のSpeedster7t 。さらに、まだ公開されていないものもあります。
だから、今それを検討しているところだ。繰り返しになりますが、必要な要件の詳細についてのフィードバックをお待ちしています。ユースケースによっては、GPUクラスのフル・カードのサブセットが必要になるかもしれません。アプリケーションのために外部メモリを気にしない顧客もいます。DDR6の代わりにSRAMを好む人もいるでしょう。
ですから、ご意見をお聞かせいただく絶好の機会です。ぜひご連絡ください。
マーカス・ウェドル(59分27秒)
オーケー。もう2つ見てみましょう。そのうちの1つは競合他社との比較です。競合製品との比較について詳しく説明したいのですが、ここで質問させてください。ザイリンクスの次世代デバイスであるVersalチップと比較して、S7tの利点は何でしょうか?クレイグとスティーブ、両氏の見解をお聞かせください。
スティーブ・メンソール
チップレベルでもボードレベルでも答えがあるからね。チップ・レベルで考えてみましょう。Versalは、AI問題をベクトルエンジンで解決しようとするヘテロジニアスアーキテクチャです。高速IO、FPGAファブリック、ベクターエンジン、CPUコンプレックスです。
興味深いことだ。最終的にさまざまなタイプのアプリケーションに対応するために、使い勝手の良いシステム開発フォーマットで、これらの異なるコンストラクト間でデータをどのように移動させるかを証明しなければならないだろう。Speedster7t一方、FPGAにはいくつかの特徴がある。それは、FPGAファブリック内でAI機能に対応する、より伝統的なFPGAアーキテクチャです。先ほどお話ししたMLPブロックは、FPGA内で非常に高いAI性能を発揮するため、データを基本的にフォーマットしてからデバイスの別の部分に移動する必要がありません。- その1。番目は、先ほどお話しした2D NoCです。これは非常に魅力的なアーキテクチャ機能で、従来のように、接続性、イーサネットとの通信方法、メモリ・インターフェースとの通信方法など、多くの回路を設計する必要がなくなります。その代わりに、デバイス全体に分散されたNoCアクセス・ポイントが持つ標準AXIインターフェイスを使うことになる。そしてその時点で、2D NoCがすべてを引き受けます。そのため、ロジックの輻輳やタイミング・クロージャーの問題が発生しないため、はるかに高いパフォーマンスが可能になります。そして最終的には、貴重なFPGAリソースを大幅に節約できるため、従来のFPGAを使用した場合よりもはるかに高密度のFPGAを実現できます。
マーカス・ウェドル
そしてクレイグ、君の見解も聞かせてくれ。
クレイグ・ペトリ
そうですね。ですから、他のFPGAベンダーとの比較も当然出てくると思います。Intelからは、Agilex 。これはより伝統的なタイプのFPGAで、例えばNoCはありません。多くの点でStratix10によく似ている。ザイリンクスに関しては、Versalチップを発表していますが、NoCを搭載していますし、SteveがSpeedsterデバイスの機能のいくつかに言及していますので、それとの比較も可能です。カード・レベルでは、顧客がカード間の直接比較を行えるような情報はほとんどありません。IntelのAgilex を見ると、Agilex で利用できるようになるDev Kitがあると思います。これは一種のラボ環境用のカードで、ベンチで使用するタイプで、さまざまなコネクターが搭載されています。ザイリンクスからは、そのような製品が出てくるでしょう。
ちょうど今週サンノゼとヨーロッパで開催されたXDFのイベントに参加された方もいらっしゃると思いますが、Versalはカードレベルで利用可能です。しかし、繰り返しますが、これは単なるDev kitです。つまり、ラボでPoCを行う少量生産向けのものです。このカードは、もちろんラボでデモをしたり、概念実証をしたりするのに使えます。しかし、このカードは配備できるようにゼロから設計されています。少量でも大量でもコスト効率に優れ、非常に高い品質と信頼性を持つように設計されています。そのため、アchronixとBittWare のマーケティング・メッセージでは、このカードをエンタープライズ・クラスの製品として位置づけています。しかし、私たちは、Speedster 7tデバイス、ACEツール、カード・レベルの機能、そしてサーバー・レベルの機能によって、お客様に本当に優れたパフォーマンスと、さまざまなアプリケーション・タイプにカードを使用できる柔軟性を提供できると考えています。
マーカス・ウェドル(1:04:27)
ありがとう。そして、来週のお知らせです。スーパーコンピューティング・ショーにいらっしゃる方は、S7tボードをご覧いただけます。もちろんショーボードですが、AchronixまたはBittWare/Molexのブースにぜひお立ち寄りください。
えーと、質問があるんだけど。クレイグのためにまとめて質問しておこうと思う。ひとつはJTAGについて、もうひとつはボードの回路図についてです。質問1.そのボードには、プログラミングやデバッグ用のJTAGアダプターがすでに搭載されていますか。また、JTAG USBを使用する場合、ビットストリームのロードにかかるアップロード時間はどのくらいですか。そして質問2. カードにはリファレンス回路図が付属していますか?
クレイグ・ペトリ
では、スティーブ、カードレベルから始めましょうか。いい質問ですね。JTAGアクセスとデバッグはローテクですよね?超高速ではありませんが、ユーザーエクスペリエンスやカード機能の一部へのアクセス方法にとっては非常に重要です。
そこで、BittWareのBMC(ボード・マネージメント・コントローラー)のすべての利点が発揮されます。カードにUSBケーブルを接続するだけで、JTAGにアクセスすることができます。
そのため、この機能を使ってビットストリームやFPGA用の実行ファイルをプログラムすることができる。おそらくほとんどのユーザーは、ホストAPIとドライバを通じて行うことを好むでしょう。つまり、PCIeバスを通じてソフトウェアだけでカードをプログラムできる。しかし、プログラミングにJTAGケーブルを使用するのであれば、それも選択肢の1つです。また、BMC、PCIeホスト、JTAGアダプターを通じて、オンボードカードのパラメータ、電力、電圧、電流、その他さまざまなパラメータを読み出すこともできます。
アプリケーションの開発中も、実際にアプリケーションを実行しているモニタリング中も、お客様に良いユーザー・エクスペリエンスを提供できることを願っています。スティーブ、何か追加することはありますか?
スティーブ・メンソール
いや、完璧な表現だ。
マーカス・ウェドル
わかりました。続いて、1つだけ簡単な質問があります。USB to JTAGとFPGA UART以外に、BMCが提供する他の機能は何ですか?ある程度は答えられたと思いますが、もしクレイグさんがもう少し詳しく説明したいのであれば、それは良いことだと思います。
クレイグ・ペトリ
ああ、前の質問に完全に答えていなかったことに今気づいたよ。回路図は提供されるのかという質問がありました。ですから、回路図は製品のデフォルトの納品物として提供されるものではありません。 顧客が回路図情報を必要とするのは、特定の状況下においてのみです。私たちが提供するハードウェア・リファレンス・ガイドには多くの詳細が記載されていますので、お客様がビットストリームを開発するために必要な情報がすべて記載されていることを期待しています。
もしお客様が回路図情報を必要とする理由があり、デジタルIOヘッダーや拡張ポートを使用している人がいて、カードがどのように機能するのかをもう少し理解したいという可能性があるのであれば、それは問題ありません。私たちはNDAの下で回路図情報を共有しています。これは、BittWare が所有する知的財産ですので、慎重に管理したいと思います。ですから、質問をお持ちのお客様には必ずお答えします。その際、必要な情報がすべて得られるよう、回路図の一部を共有することもあります。
BMCに関するもうひとつの質問については、おそらくほとんどカバーできていると思います。ウェブサイトには、BMCの詳細やその仕組みについて、例も含めて詳しく説明した良い情報がたくさんあります。ウェビナーの要約の一部として、ウェブサイトからその情報へのリンクを提供することになると思います。
マーカス・ウェドル
All right. Yes, that sounds good. I think that said, I think we’ve certainly gone into a lot of Q&A and I appreciate that. Just everyone on the call, again, we’re here for you. Send us more questions offline. Obviously, the best way to do that is to go to our respective websites, achronix.com and www.bittware.com
もっと多くの質問を聞いたり、1対1で話したり、おしゃべりする時間を設けたりしたい。それは素晴らしいことです。でも、そうでなければ、このウェビナーでこの新しいカードを十分に味わっていただけたと思います。申し上げたように、私たちは来週のSC19に出展する予定です。私たちのブースにお越しいただければ、さらに詳しくお話しすることができます。
今回もパネリストの皆さん、ありがとうございました。Q&Aもたくさんしていただき、ありがとうございました。今後もこのようなウェビナーを開催する予定ですので、それぞれのウェブサイトをチェックしてください。
AI金融取引モデル用アクセラレータ 超低遅延・高スループット機械学習推論 金融の様々なアプリケーションに適しています。
記事 ホモモーフィック・エンクリプションアクセラレーション FPGAアクセラレーション このユニークなソリューションは、暗号化されたデータに対して、復号化や鍵の共有なしに計算を可能にします。 従来の暗号化は暗号化の限界
ホワイトペーパー Synthetic Traffic Generator Reference Design Overview Synthetic Traffic Generatorは、ネットワークポートを備えたFPGAデザインのラボテストを可能にします。他にも様々な用途がありますが
PCIe FPGA Card XUP-VV4UltraScale+ FPGA PCIe Board with VU13P 4x 100GbE and up to 512GB DDR4 価格の見積もりは必要ですか?見積もりフォームへジャンプ
45 South Main Street, Concord, NH 03301|コンコード、ニューハンプシャー州 603-406-6200 | 連絡先