コンテンツにスキップ
Dev Classmethod Jp Articles Dgx Spark Vss 3 2 Ga Revisit

NVIDIA VSS 3.2.0 GA を DGX Spark で動かしてみた

  • URL: https://dev.classmethod.jp/articles/dgx-spark-vss-3-2-ga-revisit
  • 日付: 2026-06-26
  • Tier: Tier 2
  • 要旨: NVIDIA の VSS(Video Search and Summarization)が 2026 年 6 月 16 日に 3.2.0 として GA リリースされた。クラスメソッドの森茂氏が DGX Spark(GB10 搭載、128 GiB Unified Memory)上でフル構成を実機検証した記録。主な変更点は全マイクロサービスのソース公開(Apache-2.0 + MIT)とデプロイ構造の刷新で、base profile では Local LLM(Nemotron-Nano-9B-v2 FP8 on vLLM)がそのまま動作することが確認された。公式ドキュメントでは DGX Spark を「Remote LLM 限定」と位置付けているが、実装レベルでは base profile に限り Local LLM が動く状態になっている。

詳細

VSS 3.2.0 GA(2026-06-16 リリース)の主要変更点は以下の通り。

NEW: 全マイクロサービスとエージェントワークフローの GitHub ソース公開(Apache-2.0 + MIT)、Agent Skills (EA)、NemoClaw + VSS (EA)、RT-CV-3D(Sparse4D v2.2)+ Auto Calibration、音声付き動画理解(Nemotron 3 Nano Omni)。

CHANGED: キャプション生成エンドポイントが /v1/generate_captions_alerts から /v1/generate_captions にリネーム、base profile から Envoy/SDR routing を撤去、デプロイ構造を developer-profiles/ + services/ の include モデルへ刷新。

FIXED: 重複 stream/camera ID に HTTP 409 を返すよう変更(旧は silent overwrite)、Riva ASR NIM の compose 同梱を停止。

デプロイ構造の実態として、dev-profile.sh が nvidia-smi の GPU 名から DGX-SPARK を自動判定し HARDWARE_PROFILE=DGX-SPARK を generated.env に書き込む。HAProxy がポート 7777 で API Gateway 役を担う。

Local LLM の動作確認として、docker inspect でコンテナが nvcr.io/nvidia/vllm:25.12.post1-py3 で起動していることを確認。モデルは nvidia/NVIDIA-Nemotron-Nano-9B-v2-FP8、gpu-memory-utilization 0.40、tensor-parallel-size 1 で起動。tool-call パーサは nemotron_json を指定。

起動時間の実測では、Image pull 約 55 秒、Container 起動カスケード約 13 分(VLM NIM の TRT-LLM コンパイル待ちが支配的)。純粋な起動カスケードは約 9 分、合計 10 分前後が代表値。

API 上の注意事項として、同一 stream_id / camera_id に対し ServiceException(DuplicateStreamId / DuplicateCameraId、HTTP 409)が返る。同じ RTSP URL への複数回呼び出しは UUID v4 で別ジョブとして扱われる。base profile では Envoy + SDR routing を経由せず Stream Processing に直接接続。

ソース公開による自前ビルドの検証として、services/agent/docker/Dockerfile から multi-stage ビルドを実施。security-patches ステージで libssl3 の固定 URL(3.0.19-1~deb12u2)が HTTP 404 になる問題が発生し、apt-get download libssl3 による自動取得に書き換えることで回避した。修正後のビルドは約 8 分で完走し、最終 image サイズは 1.98 GB と公式 image と同一サイズに収まった。

公式の DGX Spark ポジションは「AGX/IGX Thor および DGX Spark は Remote LLM 構成のみサポート、Local 完全デプロイは将来リリース予定」だが、hw-DGX-SPARK.env と vLLM 公式 compose の組み合わせで base profile に限り Local LLM が実動作する状態になっている。alerts / search プロファイルは依然 Remote LLM 必須。

Riva ASR NIM は 3.2 で compose から撤去され、Nemotron 3 Nano Omni VLM のネイティブ audio パスに切り替わった。次回記事で実機検証予定とのこと。