コンテンツにスキップ
Dev Classmethod Jp Articles Aws Pask Physai CLI Training Evaluation Pipeline

AWSのPhysical AI Scaffolding Kit (PASK)を試す④ — physai CLIで学習〜評価をパイプライン実行する

  • URL: https://dev.classmethod.jp/articles/aws-pask-physai-cli-training-evaluation-pipeline
  • 日付: 2026-06-23
  • Tier: Tier 2
  • 要旨: AWSのPhysical AI Scaffolding Kit(PASK)シリーズ第4回。physai CLIツールを使用してHyperPodクラスタ上のロボット学習パイプライン(データ変換・学習・評価)を構築・実行する手順を解説。PC側のローカルCLIがSSH/rsync経由でクラスタのSlurmジョブを制御する設計。SO-101ロボット、LeIsaac Sim環境、GR00T N1.6モデルを使用したサンプルで成功率50%を達成。

詳細

physai CLIはPC側で動作するローカルツール。SSH/rsyncを使ってHyperPodクラスタのSlurmに接続し、ジョブ投入(sbatch)・状態確認(squeue/sacct)・ログ取得・ファイル同期を行う。専用デーモンやクラスタ常駐エージェントは不要。

デプロイ手順は7フェーズ構成。CDK でインフラ展開(VPC/S3/FSx/RDS + HyperPod)は約25分、その後CLI設定・SSH設定・コンテナビルド(3本、30〜40分)・データセット準備・学習実行(1.5時間)・評価(45分)。

実装上の注意点3つ。(1)physaiはクラスタ内ではなくPC側で実行(クラスタ内でコマンドを打つと見つからない)。(2)デプロイ前にphysai/infra/package.jsonにts-nodeを追加(cdk synthが失敗する)。(3)macOSはbrewで最新rsync 3.xをインストール必須(同梱openrsync 2.6.9は–info=progress2をサポートしない)。

学習フェーズはphysai runで投入。–from trainでconvert をスキップして学習のみ実行。評価はLeIsaac上で20ラウンド実行してmetrics.jsonに成功率を記録。ワーカーGPU課金は終了後にcleanup.shで段階的に削除(クラスタ→FSx/RDS→S3→インフラスタック)。