엔비디아에 따르면, 테스트는 40개에서 800개까지 다양한 GPU 서버를 클라이언트로 설정해 진행됐으며, 모든 경우에서 스펙트럼-X가 기존 RoCE v2 환경보다 더 높은 성능을 보였다. 스펙트럼-X 네트워크를 적용했을 때 읽기 대역폭은 20%에서 최대 48%까지, 쓰기 대역폭은 9%에서 최대 41%까지 향상됐다.
또한 효율성을 높이는 또 다른 방법으로 ‘체크포인트 저장(checkpointing)’을 활용할 수 있다. 이는 처리 작업의 상태를 주기적으로 저장해, 학습이 중단될 경우 처음부터 다시 시작하지 않고 저장된 상태에서 재개할 수 있도록 하는 기술이다.
엔비디아는 DDN, 델, HPE, 레노버, VAST 데이터(VAST Data), 웨카(WEKA) 등 주요 스토리지 파트너가 향후 스펙트럼-X 기능을 지원할 가능성이 높다고 밝혔다.
dl-ciokorea@foundryco.com