コンテンツにスキップ
Zenn Dev Akasara Articles E81a2b495f4bbe

Claude Opus 4.6がリリース — 100万トークン・Agent Teams・PowerPoint統合など新機能まとめ

  • URL: https://zenn.dev/akasara/articles/e81a2b495f4bbe
  • 日付: 2026-06-26
  • Tier: Tier 3
  • 要旨: 2026年2月5日リリースのClaude Opus 4.6について、100万トークンコンテキスト(Opusクラス初)・Agent Teams・PowerPoint統合・Adaptive Thinking・Context Compactionの5つの主要機能とベンチマーク結果を整理した記事。ARC AGI 2では37.6%から68.8%へと大幅改善し業界トップとなった一方、SWE-bench VerifiedはOpus 4.5の80.9%から80.8%へわずかに低下。フロンティアレッドチームがリリース前テストでオープンソースコード内に500件超の未知のゼロデイ脆弱性を発見したことも注目点。価格はOpus 4.5から据え置き(入力$5/出力$25)。

詳細

  • モデル概要: claude-opus-4-6、2026年2月5日リリース、コンテキスト100万トークン(ベータ)、最大出力128,000トークン、20万トークン超はプレミアム価格(入力$10/出力$37.50)
  • 100万トークンコンテキスト: MRCR v2(needle-in-a-haystack)で76%、Sonnet 4.5の18.5%と比較して圧倒的
  • Agent Teams(リサーチプレビュー): フロントエンド/API/マイグレーション担当等に作業分割して並列自律連携。API利用者・サブスクリプションユーザー向け
  • Claude in PowerPoint(リサーチプレビュー): 既存スライドのレイアウト・フォント・テンプレートを読み取りデザインガイドに沿った生成・編集。Max/Team/Enterpriseプランのみ
  • Adaptive Thinking: コンテキストの手がかりから思考深度を自律判断。API effortパラメータでlow/medium/high/maxの4段階を明示指定可能
  • Context Compaction(ベータ): 長時間API対話で古い会話を要約してコンテキスト確保
  • US Data Residency: 米国内限定ワークロード実行オプション、10%料金上乗せ
  • ベンチマーク結果:
    • ARC AGI 2: Opus 4.6が68.8%(4.5の37.6%から大幅改善)、GPT-5.2は54.2%
    • BrowseComp: Opus 4.6が84.0%(4.5の67.8%から向上)
    • SWE-bench Verified: Opus 4.6が80.8%(4.5の80.9%からわずかに後退)
    • Terminal-Bench 2.0: Opus 4.6が65.4%で業界トップ
    • MCP Atlas(ツール使用): Opus 4.6が59.5%(4.5の62.3%から若干後退)
  • ゼロデイ発見: GhostScript・OpenSC・CGIFで500件超の未知の脆弱性をリリース前に発見・報告
  • 市場影響: Claude Coworkプラグインにより法務・金融分析ソフトウェア株が急落。Anthropicは30万社超の有料法人顧客を持ちエンタープライズが事業の約80%