인텔 애자일렉스 FPGA가 탑재된 IA-860m PCIe 가속기
IA-860m 대용량 메모리 대역폭 차세대 PCIe 5.0 + CXL M-시리즈 Agilex, HBM2e 탑재 인텔 Agilex M-시리즈 FPGA는 처리량이 많은 애플리케이션에 최적화되어 있습니다.
비트웨어의 데이터 레코더 레퍼런스 디자인은 최대 200Gb/s의 고속 센서 데이터를 NVMe SSD(솔리드 스테이트 드라이브)로 캡처합니다. 이를 통해 사용자는 필요한 모든 데이터 레코더 시스템을 구축할 수 있는 개방형 아키텍처를 사용할 수 있지만, "주어진 데이터 속도를 유지하려면 몇 개의 드라이브가 필요한가?"라는 질문을 자주 듣게 됩니다.
SSD 공급업체의 쓰기 속도에 대한 드라이브 사양을 살펴보고 애플리케이션에 필요한 최대 지속 대역폭을 나누고 약간의 여유를 더하면 필요한 RAID0(스트라이프) 드라이브의 수를 알 수 있다고 생각하는 경우가 많기 때문에 이 문제를 해결하고자 합니다. 문제는 SSD 사양서의 쓰기 수치가 고성능 고객의 긴 기록 시간 동안 지속 가능하지 않다는 것입니다.
일반적인 SSD 드라이브 유형을 사용한 몇 가지 실제 성능 수치를 살펴보고 지속적인 쓰기가 읽기 속도만큼 간단하지 않은 이유를 알아봅시다. 그런 다음 데이터 레코더 레퍼런스 디자인을 사용하여 주어진 속도에 맞는 드라이브 어레이에 대한 몇 가지 권장 사항으로 마무리하겠습니다. 좋은 소식은 이 설계가 TeraBox 서버와 250-SoC FPGA 카드를 사용하여 필요에 따라 쉽게 확장할 수 있다는 것입니다.
NVMe 인터페이스가 탑재된 솔리드 스테이트 드라이브는 매우 빠른 것으로 알려져 있습니다. 실제로 특정 워크로드에서 기존 하드 디스크 드라이브(HDD)보다 빠릅니다. 특히 SSD는 쓰기보다 읽기 및 랜덤 액세스에 더 최적화되어 있습니다. 물론 데이터 레코더의 경우 그 반대인 순차적 쓰기에 중점을 둡니다.
또 다른 문제는 NVMe SSD의 최대 '스트리밍 쓰기' 대역폭 사양이 드라이브 용량의 일부로만 제한되는 경우가 많기 때문에 지속적인 쓰기를 수행할 때 문제가 발생한다는 것입니다. 장시간 지속 쓰기의 대부분은 이 수치를 크게 밑돌며, 드라이브가 커질수록 성능은 더 나빠지게 됩니다. 그 이유를 알아보기 위해 SSD에 비트가 저장되는 방식을 간략히 살펴보겠습니다.
SSD 밀도가 높아진다는 것은 지속적인 쓰기 속도가 느려지는 최신 기술로 이동한다는 것을 의미합니다. 이러한 SSD 기술 세대는 시장에 등장한 순서대로 SLC, MLC, TLC, 마지막으로 QLC라고 불리며, 밀도가 가장 낮은 순서에서 가장 높은 순서대로도 불립니다. SSD 설계자들은 시간이 지남에 따라 스트리밍 쓰기 속도가 느려진다는 사실을 잘 알고 있습니다. 따라서 가장 최신의 고밀도 SSD라도 구형 SLC 모드에서 작동하도록 일부를 남겨두는 경우가 많습니다. 이렇게 하면 드라이브의 해당 부분이 채워질 때까지 쓰기 스트리밍이 이전의 빠른 속도로 이루어집니다. 그 이후에는 쓰기 스트리밍 속도가 나머지 드라이브에서 지원하는 속도로 느려집니다.
처음 세 가지 임계값은 벤치마크 섹션에서 자세히 살펴볼 수 있습니다.
레코더가 이전 데이터를 최신 데이터로 덮어쓰기 시작할 때 발생하는 또 다른 감소가 있습니다. 이에 대해서는 다음 섹션에서 다루겠습니다.
특정 드라이브를 벤치마킹하기보다는 소비자 및 엔터프라이즈 시장의 사례를 선택하는 것이 목표였습니다:
이것은 SLC 캐시가 있는 일반적인 TLC 소비자용 드라이브입니다.
RAID 0 구성에는 최소 8개의 드라이브가 필요합니다.
이 드라이브는 SLC 캐시가 없는 소비자 시장을 겨냥한 MLC 드라이브입니다.
RAID 0 구성에는 최소 6개의 드라이브가 필요합니다.
이 드라이브는 SLC 캐시가 없는 소비자 시장을 겨냥한 MLC 드라이브입니다.
RAID 0 구성에는 최소 10개의 드라이브가 필요합니다.
옵테인 드라이브는 3D XPoint 메모리 기술을 사용하며 기존 SSD 드라이브보다 내구성이 훨씬 뛰어납니다. 하지만 기존 NVMe 드라이브 기술과 같은 고용량으로 제공되지는 않습니다.
RAID 0 구성에는 최소 6개의 드라이브가 필요합니다.
PCIe Gen4를 사용하는 드라이브는 성능이 크게 향상되었습니다. 최적화된 데이터 이동 엔진을 활용하기 위해 256KB 이상의 대용량 버퍼 크기를 사용했습니다.
RAID 0 구성에는 최소 5개의 드라이브가 필요합니다.
드라이브 크기를 늘리기 위해 멀티셀 아키텍처를 사용하면 장시간 쓰기가 지속되는 대가를 치러야 합니다. 이는 소비자용 SSD에 가장 큰 영향을 미칩니다. 청구된 최대 수치와 일치하는 최고의 실제 스트리밍 쓰기 속도는 인텔 옵테인 드라이브에서 제공되지만, 이 또한 드라이브 크기가 가장 제한적입니다.
지속 쓰기를 위해 시스템을 지정하는 경우, 핵심은 대상 드라이브에서 실제 벤치마크를 얻거나 수행하는 것입니다. 100Gb/s에서 지속 쓰기에 대한 위의 권장 사항은 이러한 실제 테스트 데이터를 기반으로 합니다.
그럼에도 불구하고 SSD에 기록할 때 고려해야 할 몇 가지 추가 고려 사항이 있으며, 이에 대해서는 다음에서 다룰 예정입니다.
쓰기 성능에서 마지막으로 고려해야 할 사항은 드라이브의 수명입니다. SSD에 쓰기를 하면 드라이브가 마모되며, 특히 데이터 레코더 애플리케이션은 드라이브의 수명에 스트레스를 줄 수 있습니다.
'엔터프라이즈' SSD에는 추가 플래시 셀(오버 프로비저닝)이 포함되어 있어 수명을 연장할 수 있습니다(더 큰 DWPD).
그러나 이 예는 예시일 뿐 현실적인 예는 아닙니다.
SSD는 기존 하드디스크 드라이브에 비해 인상적인 성능을 제공하지만, 애플리케이션에 따라 성능이 향상되고 경우에 따라 성능이 저하될 수 있습니다.
데이터 캡처 및 레코더 프로젝트의 대상과 같이 지속적인 쓰기가 있는 애플리케이션의 경우, 최대 지속 쓰기 사양 외에도 고려해야 할 여러 가지 요소가 있습니다.
스토리지 가속 및 센서 처리 제품 및 솔루션에 대해 자세히 알아보려면 BittWare에 문의하세요.
IA-860m 대용량 메모리 대역폭 차세대 PCIe 5.0 + CXL M-시리즈 Agilex, HBM2e 탑재 인텔 Agilex M-시리즈 FPGA는 처리량이 많은 애플리케이션에 최적화되어 있습니다.
백서 이진 가중 신경망 추론의 FPGA 가속 YOLOv3의 특징 중 하나는 단일 이미지에서 다중 객체를 인식하는 것입니다. 우리는 다음을 사용했습니다.
BittWare 파트너 IP NVMe 브리지 플랫폼 NVMe Intercept AXI-Stream 샌드박스 IP 컴퓨팅 스토리지 디바이스(CSD)를 사용하면 스토리지 엔드포인트에서 다음과 같은 컴퓨팅 스토리지 기능(CSF)을 제공할 수 있습니다.
비트웨어 파트너 IP 쿼리 처리 장치(QPU) PCIe Gen4 속도로 저장된 데이터 또는 스트리밍 데이터를 쿼리, 분석 또는 재포맷하는 FPGA 기반 가속기를 구축하세요! Eideticom의 쿼리