コンテンツにスキップ
Zenn Dev Google Cloud Jp Articles 63205d90345627

Gemini を Claude の「サブエージェント」に —— 大規模開発でコストを実測

  • URL: https://zenn.dev/google_cloud_jp/articles/63205d90345627
  • 日付: 2026-06-27
  • Tier: Tier 3
  • 要旨: Claude Codeを指揮層、Gemini(Antigravity CLI)を実行層とする2層ハイブリッド構成のプラグインを実装し、実測でClaudeコストを27〜64%削減しつつ同品質(adk eval全通過)を達成した報告。「判断は優秀なモデル、量産はコスパの良いモデル」という振り分け設計の実装と効果の裏付けが中心。

詳細

Uber社が約5000人へのClaude Code展開で4ヶ月でAIコーディング年間予算を使い切った事例やMicrosoftの社内Claude Codeライセンス停止報道を背景として、エージェントのコスト問題の構造を分析している。コストの主因は出力でなく入力であり、エージェントは毎ターン文脈を読み直すcontext snowball効果で後半ほど高くなること、トークンを増やしても性能は上がらないこと(AnthropicはエージェントでFLOP比約4倍・マルチで約15倍、Stanfordは入力主導でトークン増≠性能と報告)を整理し、「コンテキストを薄く保ち量産を別モデルへ逃がす」設計の根拠としている。

実装はClaude Code Plugin Antigravity for Claude Codeとして公開。核心は「いつ・どう委譲し・どう検証するか」を定義したSKILL.mdと、ツールを委譲ラッパー(agy-delegate.sh)だけに制限した委譲専用サブエージェント。Claude側はファイル内容の生成にトークンを使わず、Gemini側でファイル生成を完結させる設計。セッション開始フックでコスト方針を自動注入し、スラッシュコマンド(delegate/review/research/status/result/cancel)から操作できる。

実測比較はGoogle ADKでのSDLCアシスタント(要件定義→基本設計→詳細設計をSequentialAgentで連結)の構築をタスクとし、Claude単独@high・単独@max・ハイブリッドの3アームで比較。ハイブリッドはターン数87(vs 126・154)、Claude側実額$9.56(vs $13.08・$26.71)で、adk eval 3/3を全構成が通過した。cache_readはハイブリッドが最小(5.65M vs 10.19M・20.45M)で、Geminiへ逃がした生成分はClaudeのトークン計上外のため実差はさらに大きい。

使いどころは大規模機能・一括移行・網羅テスト・多エージェント構築・大量ドキュメント横断など「まとまった仕事」で、小さな単発タスクは往復コストが勝るためClaude直が正解としている。コスト以外の付加価値としてVertex AI Searchによる社内データgrounding、クロスモデル検証、ADKのAgent Engineデプロイ一気通貫も挙げている。公開後にRedditで27K views・84 upvotesの反応を得ており、WSL環境での/mntマウントI/O遅延やヘッドレス時の挙動など実フィードバックを取り込んで改善を継続中。