메그 컴퓨팅 CEO PK 굽타 인터뷰

비디오 대본

소개

마커스 웨들, 비트웨어

오늘은 AI 기반 비디오 분석 솔루션에 대해 Megh Computing과 이야기를 나눠보겠습니다.

Megh가 언급한 통계에 따르면 올해 10억 대의 새로운 카메라가 출시될 예정이지만 놀랍게도 이 카메라에서 촬영된 비디오의 95%는 분석되지 않을 것이라는 점을 먼저 언급하고 싶었습니다. 이는 일반적인 이야기가 되고 있습니다. 수많은 새로운 센서가 곳곳에 설치되어 있지만, 그 데이터로 무엇을 효과적으로 할 수 있는 방법을 찾지 못해 센서에 대한 비용만 지출하고 데이터에서 분석을 얻는 데는 투자 대비 수익이 제대로 나오지 않습니다.
그래서 비디오 분석에 더 쉽게 접근하는 방법에 대해 이야기하기 위해 Megh 컴퓨팅의 PK Gupta를 초대했습니다!

PK 굽타, 메그 컴퓨팅

안녕하세요, 마커스, 만나서 반갑습니다. 감사합니다.

Marcus

앞서 말했듯이 전 세계에는 수많은 카메라와 수많은 센서가 도처에 있습니다. 예를 들어 한 공장에 50대의 IP 카메라가 레코더에 연결되어 있지만 실제로 해당 영상에 대해 조치를 취할 수 있는 방법이 없을 수 있습니다. 이 문제를 어떻게 해결할 수 있는지 설명해 주시겠어요?

PK

네, 물론이죠. 일반적으로 말씀하신 시나리오는 소규모 공장이나 소규모 비즈니스에서 수십 대의 카메라 또는 몇 대의 카메라가 NVR에 연결되어 있는 매우 일반적인 경우입니다. 그리고 일반적인 사용법은 비디오를 녹화하고 대부분의 비디오를 보는 것입니다. 하지만 실제로 영상, 즉 영상에 담긴 정보를 제대로 활용하지는 않죠?

따라서 동영상에서 인텔리전스를 추출하고 비즈니스에 많은 가치를 더하는 실행 가능한 인사이트를 창출하기 위해 실시간으로 동영상을 처리할 수 있는 기능이 부족합니다. 이것이 바로 이 문제를 해결하기 위한 솔루션, 즉 비디오 분석 솔루션을 제공하는 Megh가 놓치고 있는 부분입니다.

Marcus

그렇다면 공장 내에서, 그리고 다른 사용 사례에서도 분석이라는 단어가 단순히 영상을 보는 것이 아니라 사용자가 분석할 수 있는 구체적인 실행 가능한 결과를 의미하기 때문에 분석의 예는 무엇일까요?

PK

네. 공장 환경에서의 몇 가지 사용 사례를 예로 들어보겠습니다. 공장 환경에서 AI와 함께 지능형 비디오 분석을 사용하는 경우, 작업자 안전과 프로세스 개선을 위한 몇 가지 일반적인 사용 사례를 지원할 수 있습니다. 예를 들어, 작업자 안전을 위해 작업자가 안전모나 장화, 헬멧 등 작업 환경에 필요한 모든 것을 착용하고 있는지 확인하기 위한 PP 규정 준수를 위한 사용 사례를 지원합니다.

또한 작업자 안전을 위해 충돌 방지를 지원하는 사용 사례도 있습니다. 그리고 작업자 안전을 위한 다른 사용 사례로는 작업자 유출 방지 또는 작업자의 낙상 여부 추적 등이 있습니다. 이러한 사용 사례는 작업자 안전을 위해 스마트 팩토리에 적용할 수 있는 사용 사례입니다.

또한 비디오 분석을 사용하여 공장의 운영 프로세스 환경을 모니터링하고 효율성을 높이기 위한 개선 사항을 제안할 수 있습니다. 예를 들어, 공정 라인에서 작업하는 사람의 수와 이들이 얼마나 효율적으로 작업하고 있는지, 작업 공간에서 시간을 어떻게 활용하고 있는지 등을 모니터링할 수 있습니다.

이 모든 것을 사용하여 작업 효율성, 즉 공장의 전반적인 프로세스 효율성을 개선할 수 있습니다.

공장 외에도 배회자 감지, 침입 감지 등 물리적 보안을 위해 스마트 빌딩에서 지원할 수 있는 사용 사례가 있습니다. 마찬가지로 스마트 시티의 설정에서 지원할 수 있는 다른 사용 사례도 있습니다.

Marcus

이제 실행 가능한 인사이트가 구체적으로 무엇을 의미하는지에 대해 조금 더 집중해 보겠습니다. 보안 카메라에서 하드 드라이브에 비디오를 녹화하고 프레임의 특정 움직임에 민감하게 반응하는 아주 간단한 움직임에 민감한 작업을 수행하는 것은 모두 잘 알고 있을 것입니다. 하지만 Megh VAS 제품군은 그 이상의 기능을 제공합니다. 데모 분석을 실행하는 영상이 있으니, 재생되는 모습을 보고 어떤 생각이 들었는지 말씀해 주시면 좋겠습니다.

PK

네. 따라서 분석은 비디오 스트림을 분석하고 몇 가지 비즈니스 규칙을 적용하여 비즈니스 프로세스를 개선하거나 운영 위험을 줄이는 데 사용할 수 있는 비디오에 대한 인사이트를 얻는 기능입니다.

지금 보시는 영상 중 일부는 스마트 빌딩 애플리케이션의 침입 감지 사례로, 공장 환경에서도 누군가 침입을 시도하면 이를 모니터링하여 사람을 식별하고 알람을 울리는 장면을 담고 있습니다.

일반적으로 알람은 애플리케이션에 알림으로 전송되며 운영자는 이에 따라 조치를 취할 수 있습니다. 침입 감지의 예가 있습니다. 공공 안전을 위해 누군가 건물 밖을 배회하는 경우, 운영자는 이를 추적하고 해당 상황에 대처하여 직원이나 방문객의 안전을 개선하고자 하는 배회 감지의 예가 있습니다.

다음은 물리적 보안 환경에서 비디오 분석을 사용하여 실행 가능한 인사이트를 얻은 구체적인 사례입니다.

Marcus

다음 질문은 고객을 얼마나 맞춤화할 수 있는지입니다. 카메라는 있지만 고급 AI 기능은 거의 없는 고객이 있다면 필요한 모든 것을 제공할 수 있을까요, 아니면 고객이 직접 모델을 가져와야 할까요? 그리고 훈련된 모델을 보유하고 있지만 TCO를 더 잘 활용하고자 하는 고객을 위해 솔루션을 맞춤화할 수 있나요?

PK

Megh는 완전히 사용자 정의 가능한 크로스 플랫폼 분산 솔루션을 제공합니다. 즉, 당사의 솔루션은 오픈 애널리틱스의 세 가지 주요 원칙 또는 기둥이라고 부르는 원칙을 기반으로 구축되었습니다.

첫 번째는 개방형 커스터마이징입니다. 비디오와 이 파이프라인을 완전히 커스터마이징할 수 있습니다. 몇 가지 표준 사용 사례를 위해 자체 고급 AI 라이브러리를 만들기도 합니다. 하지만 자체적으로 훈련된 모델을 보유하고 있는 고객과도 협력합니다.

그리고 이를 플랫폼에 매우 빠르고 효율적으로 배포할 수 있는 메커니즘을 제공합니다. 이 모든 것이 커스터마이징의 일부입니다.

두 번째 기둥은 개방형 선택에 관한 것으로, 고객이 배포에 가장 적합한 플랫폼을 선택하여 최저 TCO를 달성할 수 있도록 지원합니다. 예를 들어, 유니티는 배포를 위해 CPU, GPU, FPGA는 물론 이제는 ASIC까지 지원합니다.

오픈 애널리틱스의 세 번째 기둥은 개방형 통합입니다. 다양한 종류의 백엔드 소프트웨어와 통합하여 완벽한 엔드 투 엔드 솔루션을 제공할 수 있습니다.

요약하자면, Megh는 사용자가 비디오 분석 솔루션을 구현할 수 있도록 완벽한 제어 기능을 제공합니다.

Marcus

이미 고객의 다양한 환경에 적합한 솔루션을 확보한 것 같습니다. 하지만 TCO 개선을 위한 하드웨어 가속을 포함하는 두 번째 기둥에 대해 자세히 살펴봅시다. 여기에는 BittWare 520NX가 포함되는데, 확장해야 하는 고객이 있을 때 이 솔루션이 어떻게 적합할까요?

PK

따라서 앞서 언급한 개방형 선택의 두 번째 축의 일부로 CPU, GPU, FPGA, 심지어 ASIC까지 지원합니다. 소매점이나 소규모 공장에 카메라 몇 대를 설치하는 소규모 배포의 경우, ARM 프로세서 또는 x86 코어 몇 개를 탑재한 소형 엣지 서버에 카메라를 설치할 수 있습니다. 그런 다음 사람들이 더 많은 카메라를 배포함에 따라 확장할 수 있습니다. GPU를 추가하면 10~20대의 카메라까지 확장할 수 있습니다.

하지만 대규모 캠퍼스 환경에 수백, 수천 대의 카메라가 있는 캠퍼스 환경과 같이 매우 고밀도 애플리케이션의 경우에는 더 많은 처리 능력이 필요합니다. 이 경우 훨씬 더 많은 처리 능력이 필요하며, 일반적으로 엔터프라이즈 서버 또는 하나 이상의 서버에 각각 하나 이상의 FPGA 가속기 카드가 있는 솔루션을 배포합니다.

최근에 사용하고 있는 카드 중 하나는 BittWare의 520NX입니다. 이 카드는 인텔 스트라틱스 10 NX FPGA를 사용합니다. 이 FPGA에는 딥 러닝 추론 구현을 매우 효율적으로 가속화하는 몇 가지 향상된 DSP 엔진이 있습니다.

최신 GPU 구현과 비교했을 때 520NX의 많은 모델에서 5배 이상의 성능을 얻고 있습니다. 따라서 520NX를 사용하여 일부 고밀도 애플리케이션을 타겟팅할 수 있습니다.

Marcus

이제 인텔 애자일렉스 FPGA가 적합한 사용 사례도 몇 가지 발견할 수 있습니다. 비트웨어는 높은 효율과 PCIe Gen4 이상의 하드웨어 부동 소수점 DSP를 제공하면서도 전력 소비는 더 낮은 IA-420F 카드를 보유하고 있습니다. 애자일렉스가 고객에게 어떤 도움이 된다고 생각하시나요?

PK

그래서 비트웨어가 곧 시장에 출시할 새로운 Agilex FPGA에 대해 매우 기대하고 있습니다. 앞서 말씀드린 대로 520NX는 고성능 딥 러닝 엔진에 초점을 맞추고 있습니다. 하지만 애질렉스에는 다양한 제품이 있습니다. 75와트 전력으로 제공되는 저가형 제품이 있으며, 이 제품은 단일 FPGA 카드로 소형 엣지 서버에 배포할 수 있습니다. 그리고 520NX와 동등한 성능을 제공하는 고급 Agilex 카드도 있습니다.

따라서 다양한 애플리케이션을 대상으로 하는 더 넓은 범위의 FPGA를 확보할 수 있습니다. 또한 기본 부동 소수점 지원, Agilex 카드의 FP32 지원을 통해 양자화 단계를 거치지 않고도 최신 모델을 더 빠르게 시장에 출시할 수 있는 이점을 누릴 수 있습니다.

또한 최신 PCIe 4세대는 다양한 스트리밍 애플리케이션을 지원할 수 있는 충분한 대역폭과 낮은 지연 시간을 제공합니다.

이 모든 것을 결합하여 고객의 요구를 충족할 수 있습니다. 고객의 요구는 점점 더 복잡한 맞춤형 사용 사례로 진화하고 있습니다. 특히 군사/정부/항공우주 분야에서 그렇습니다. 더 넓은 스펙트럼의 폼 팩터, 전력 사용, 그리고 시장에 빠르게 출시해야 하는 최신 모델을 포함하는 애플리케이션에 대한 수요가 증가하고 있습니다. 우리는 Agilex FPGA를 통해 이러한 고객의 요구를 충족할 수 있을 것으로 믿습니다.

Marcus

마지막 질문은 앞서 살펴본 VAS의 다양한 사용자 지정 수준에 대해 좀 더 자세히 설명해 달라는 것입니다. 고객이 빠르게 사용할 수 있는 완전한 기성 솔루션에서 더 많은 맞춤형 솔루션 모델로 전환할 수 있다는 것을 알고 있습니다. Megh는 이러한 수준에 대해 어떻게 생각하나요?

PK

저희는 고객의 요구를 충족하기 위해 두 가지 서비스를 제공합니다. 첫 번째 오퍼링은 앞서 설명한 작업자 안전, 물리적 보안 및 기타 사례에 대한 맞춤형 사용 사례 모음인 VAS Suite입니다. 이는 즉시 사용 가능합니다. 따라서 고객이 이러한 종류의 표준 사용 사례를 요청하면 매우 신속하게 배포할 수 있습니다. 저희는 레벨 1 사용자 지정이라고 부르는 것을 통해 고객이 저희의 GUI를 사용하여 구성하고 매우 빠르게 배포할 수 있도록 지원합니다.

그런 다음 사용자 지정 모델, 즉 사용자 지정 AI 모델이나 사용자 지정 분석을 지원하기 위해 파이프라인을 조정해야 할 수 있는 레벨 2 사용자 지정이라는 것이 있습니다. 이 작업은 보통 우리가 직접 수행하며, 매우 신속하게 수행하여 몇 주 내에 새로운 모델이나 새로운 분석을 도입한 다음 고객에게 배포할 수 있습니다.

세 번째 맞춤화 수준은 고객과 더 깊은 소통이 필요한 경우입니다. 매우 특별한 사용 사례이거나 매우 맞춤화된 사용 사례 또는 맞춤형 AI 모델을 사용하는 경우일 수 있습니다. 이를 위해 유니티는 고객과 직접 협력하여 애플리케이션을 구축하는 데 필요한 모든 도움을 제공하는 VAS SDK를 제공합니다. 따라서 일반적으로 시장에 출시하는 데 시간이 조금 더 걸릴 수 있는 맞춤형 모델을 구축하는 데 사용됩니다.

따라서 고객의 다양한 요구 사항을 충족할 수 있도록 다양한 수준의 사용자 지정 옵션을 제공합니다.

Marcus

Megh 컴퓨팅의 공동 설립자이자 CEO인 PK 굽타와 이야기를 나눴습니다. 그의 말대로, BittWare는 520NX, IA-420FIA-840F를 포함한 인텔 FPGA 기반 카드에 VAS Suite를 포함하는 Megh 솔루션을 제공합니다.