Megh Computing CEO PK Gupta氏インタビュー

ビデオトランスクリプト

はじめに

マーカス・ウェドルBittWare

今日は、Megh Computing社のAIを活用した映像解析ソリューションについてお話します。

メグが以前述べたように、今年は10億台の新しいカメラが登場する予定ですが、驚くことに、そのカメラの映像の95%が分析されることはない、という統計があります。これはよくある話で、あちこちに新しいセンサーが設置されているのに、そのデータを効果的に活用することができず、その結果、センサーに費用がかかり、そのデータから分析を得るという投資対効果が得られないということです。
そこで、ビデオ分析へのアクセスを容易にすることについて、Megh computingのPK Guptaさんにお話を伺います。ようこそ!

PK Gupta, Megh Computing

こんにちは、マーカス-ああ、ここに来れてうれしいです。ありがとうございます。

マーカス

今言ったように、世の中にはたくさんのカメラがあり、たくさんのセンサーが至る所にあります。例えば、工場には50台のIPカメラがあり、レコーダーに接続されていますが、その映像に対して実際にアクションを起こす方法はありません。このような状況をどのように解決しているのでしょうか。

ピーケー

ええ、その通りです。一般的に、小さな工場や中小企業では、数十台のカメラや数台のカメラがNVRに接続されていることが多いようです。そして、一般的な使い方としては、ビデオを録画し、ビデオの大半はそれを見るかもしれません。しかし、映像の情報、つまり映像に含まれる情報を適切に活用できていないのです。

そのため、動画をリアルタイムで処理し、動画からインテリジェンスを抽出して、ビジネスに大きな価値をもたらす実用的なインサイトを作成する能力が欠けています。私たちMeghは、この問題に対処するために、ビデオ分析ソリューションを提供しています。

マーカス

工場や他のユースケースでもそうかもしれませんが、アナリティクスとは、単に映像を見るだけでなく、ユーザーが分析できる具体的なアクションの結果を指す言葉ですが、どのような例がありますか?

ピーケー

では、工場でのユースケースをいくつか例に挙げてみましょう。工場でAIを活用したインテリジェントなビデオ解析を行う場合、典型的なユースケースとして、作業員の安全やプロセスの改善をサポートすることができます。例えば、作業員の安全については、作業員がハードハットやブーツ、ヘルメットなど、作業環境の一部として必要なものを着用しているかどうかを確認するPPコンプライアンスのユースケースをサポートしています。

また、作業員の安全のために衝突回避をサポートするユースケースもあります。また、作業員の安全のためのユースケースとして、流出物の回避や作業員が倒れた場合の追跡などもあります。これらは、作業員の安全のためにスマートファクトリーに適用できるユースケースなのですね。

また、ビデオアナリティクスを使用して、工場内の運用プロセス環境を監視し、さらなる効率化のための改善を提案することができます。例えば、プロセスラインで働く人の数、作業スペースでの作業効率や時間の使い方などです。

その結果、工場の作業効率、つまりプロセス全体の効率を向上させることができるのです。

工場以外にも、スマートビルディングでは、うろつき検知や侵入検知など、物理的なセキュリティのためにサポートできるユースケースがあります。同様に、スマートシティの設定でサポートできる他のユースケースもあります。

マーカス

では、具体的に「実用的な洞察」とはどういうことなのか、少し焦点をあててみましょう。防犯カメラの映像をハードディスクに録画して、フレーム内の特定の動きに反応するような、ごく簡単な動作検知を行うことは、皆さんよくご存じだと思います。しかし、メグVASスイートはそれをはるかに超えています。デモ解析を実行している映像があると思いますので、再生しながら考えてみてください。

ピーケー

そうです。アナリティクスとは、ビデオストリームを分析し、ビジネスルールを適用してビデオに関する洞察を得る機能で、ビジネスプロセスの改善やオペレーショナルリスクの低減に利用できます。

このクリップの中には、スマートビルディングのアプリケーションのための侵入検知の例もありますし、工場の環境でも、誰かが侵入しようとしたら、監視して人物を特定し、アラームを発することができます。

アラームは通常、アプリケーションへの通知として発信され、オペレーターはそれに基づいて行動することができます。侵入検知の例もあります。建物の外で誰かがうろうろしている場合、公共の安全のために、オペレーターはその状況を追跡して対処し、従業員や訪問者の安全性を向上させたいと考えます。

これらは、物理的なセキュリティのための設定で、ビデオ解析を使用して実用的なインサイトを取る具体例です。

マーカス

次の質問は、顧客に対してどの程度のカスタマイズをするのかということです。カメラは持っているが、高度なAI機能があまりない場合、必要なものをすべて提供できるのか、それとも自分でモデルを用意する必要があるのか。また、訓練されたモデルを持っていて、TCOを改善したいと考えているお客様には、ソリューションをカスタマイズしていただけるのでしょうか?

ピーケー

Meghは、完全にカスタマイズ可能なクロスプラットフォームの分散型ソリューションを提供します。つまり、私たちのソリューションは、私たちが「Open Analyticsの原則」と呼ぶ、Open Analyticsの3つの主要な原則や柱に基づいて構築されています。

1つ目はオープンカスタマイズです。ビデオとこのパイプラインのフルカスタマイズを許可しています。私たちは、いくつかの標準的なユースケースのために、独自の高度なAIライブラリを作成します。しかし、私たちは、独自の訓練されたモデルを持っているようなお客様とも協力しています。

そして、それをプラットフォーム上で非常に迅速かつ効率的に展開するための仕組みを提供します。つまり、これもすべてカスタマイズの一部なのです。

2つ目の柱は「オープン・チョイス」です。例えば、CPU、GPU、FPGA、そして現在ではASICの導入もサポートしています。

オープンアナリティクスの3つ目の柱は、オープンインテグレーションです。さまざまな種類のバックエンドソフトウェアと統合することができ、完全なエンド・トゥ・エンドのソリューションを提供します。

つまり、Meghは、ビデオ分析ソリューションを実装するために、ユーザーに完全なコントロールを提供するのです。

マーカス

それは素晴らしいことで、お客様がすでにいる場所のかなり広い範囲にフィットするソリューションがあるようです。しかし、2つ目の柱である、より良いTCOを実現するためのハードウェアアクセラレーション を拡大してみましょう。これには、BittWare 520NXが含まれます。スケールアップが必要なお客様には、どのように適合するのでしょうか?

ピーケー

2つ目の柱であるオープン・チョイスの一環として、CPU、GPU、FPGA、さらにはASICをサポートしています。小売店や小規模工場で数台のカメラを導入する場合、ARMプロセッサーや数個のx86コアを搭載した小規模なエッジサーバーに導入することが可能です。そして、カメラの台数が増えれば、規模を拡大することができます。GPUを搭載して、10~20台のカメラに対応させることも可能です。

しかし、本当に高密度のアプリケーションでは、例えば、非常に大きなキャンパスに何百台、何千台ものカメラがあるような場合です。この場合、より高い処理能力が必要になります。そこで、通常はエンタープライズ・サーバー、つまり1台または複数のサーバーに、それぞれ1枚または複数のFPGAアクセラレーター・カードを搭載してソリューションを展開します。

最近使っているカードのひとつに、BittWare の 520NX があります。このカードは、IntelStratix 10 NX FPGAを使用しています。このFPGAには、ディープラーニングの推論の実装を非常に効率的に加速させる、いくつかの強化されたDSPエンジンが搭載されています。

520NXの多くのモデルで、最新のGPU実装と比較して、5倍以上の性能を得ることができました。そのため、520NXを使用して、非常に高密度なアプリケーションをターゲットにすることができるのです。

マーカス

Agilex BittWare には、IA-420F カードがあり、高効率に加えて PCIe Gen4-more のハードウェア浮動小数点 DSP を提供しますが、さらに低消費電力でもあります。 は、どのようにお客様のお役に立つとお考えですか?Agilex

ピーケー

ですから、私たちは、BittWare が近々市場に投入する新しいAgilex FPGA に非常に期待しています。私たちは520NXを、先ほど申し上げたように非常に高性能なディープラーニングエンジンにフォーカスしています。しかし、私たちは、その多様な製品を持つAgilex を見ています。FPGAカード1枚で小型のエッジサーバーに導入できる75ワットのパワーエンベロープのローエンド製品もありますね。また、ハイエンドのAgilex 、520NXと同等の性能を持つカードがあります。

そのため、さまざまなアプリケーションをターゲットにした幅広いFPGAを提供することができます。また、Agilex カードで FP32 をサポートすることで、ネイティブの浮動小数点をサポートし、量子化フェーズを経ずに新しいモデルをより迅速に市場に投入できるというメリットもあります。

また、最新のPCIe Gen 4は、様々なストリーミングアプリケーションをサポートするために十分な帯域幅と低レイテンシーを提供します。

これらを組み合わせることで、お客様のニーズに応えることができるのです。顧客ニーズは、より複雑なカスタムユースケースへと進化しています。特に、軍事/政府/航空宇宙分野では、その傾向が顕著です。より幅広いフォームファクターや電力使用量をカバーするアプリケーションや、迅速に市場に投入する必要のある新型モデルへの需要が高まっています。Agilex FPGAは、このようなお客様のニーズに応えることができると考えています。

マーカス

PKの最後の質問は、先ほど触れたVASのカスタマイズのレベルについて、もう少し詳しく説明することです。このレベルについて、メグはどのように考えているのでしょうか。

ピーケー

私たちは、お客様のニーズに応えるため、2つのオファリングを用意しています。1つ目のオファーは、VAS Suiteと呼んでいるもので、労働者の安全や物理的なセキュリティなど、以前説明したようなカスタムユースケースの集合体です。これらは箱から出してすぐに利用できます。ですから、お客様がこのような標準的なユースケースをお求めになった場合、非常に迅速に配備することができます。レベル1カスタマイズと呼ばれるもので、GUIを使って設定すれば、すぐに導入することができます。

レベル2のカスタマイズでは、カスタムモデル、カスタムAIモデル、カスタムアナリティクスをサポートするためにパイプラインに手を加えることがあります。通常、この作業は私たち自身で行い、非常に迅速に行います。2週間以内に新しいモデルや新しい分析を導入し、お客様に展開することができます。

そして、3段階目のカスタマイズは、それが顧客とのより深い関わりを必要とする場合です。非常に特殊なユースケースや、非常にカスタマイズされたユースケース、カスタムAIモデルを身につけるような場合です。この場合、私たちはVAS SDKを提供し、お客様と直接連携してアプリケーションの構築を支援し、必要なすべてのサポートを提供します。このSDKは、通常、カスタムモデルの構築に使用され、市場に投入するまでに少し時間がかかるかもしれません。

そのため、お客様から寄せられるさまざまなニーズに対応するために、さまざまなレベルのカスタマイズオプションを用意しています。

マーカス

Megh computingの共同設立者兼CEOであるPK Guptaと話をしてきました。彼が言ったように、BittWare 、520NXIA-420FIA-840Fを含む当社のインテルFPGAベースのカードにVAS Suiteを含むMeghソリューションを提供しています。