Microsoft Build 2026まとめ ~コンテキストの海をAIが泳ぐ時代に、業務基盤屋は何を考えるか~
- URL: https://blog.cloudnative.co.jp/articles/3743617f2dbe8083
- 日付: 2026-06-20
- Tier: Tier 3
- 要旨: Microsoft Build 2026 まとめ。AI がコンテキストの海を泳ぐ時代に業務基盤屋は何を考えるか。
詳細
MS AI vision と enterprise IT 層の整合。
処理: 96件(ai-agent-implementation: 45件 / cloud,enterprise-it: 45件 / programming: 6件)
Tier 2
Codex CLI v0.140.0で追加された/usageコマンドを試した実録。TUIを離れずにトークン使用量の週次ヒートマップ・棒グラフ・累積グラフを確認できる。サブコマンドはdaily/weekly/cumulativeの3種。
Tier 2
AWSが開発中のAI-native IDE「Kiro」のWeb Automations機能を試した記事。ブラウザ操作をKiroがエージェント的に自動実行する機能で、GitHub上のPR確認・コメント投稿などをIDE内から指示できる。
Tier 2
Claude Code v2.1.181で追加されたOTLP(OpenTelemetry Protocol)認証トークンのKeychain保管機能を確認した記事。環境変数に平文で書かなくてよくなり、セキュリティと管理が改善する。
Tier 2
Claude Code v2.1.182とv2.1.183の変更点をまとめた記事。OTLPトークンのKeychain保管・/usageコマンド追加・バグ修正が主な変更。前日比の差分として日本語での整理が行われている。
Tier 2
Claude Code v2.1.181時点の便利機能・小ネタをまとめた記事。コマンドパレット・カスタムスラッシュコマンド・/cost表示・Hooks設定などを実際に操作して紹介している。
Tier 2
Claude Fable 5のシステムプロンプトをリーク情報から分析した記事。Anthropicが公開していないプロンプトの構造・指示パターン・安全制御の実装方法を読み解いた内容。
Tier 2
Google Chat BotにVertex AI RAG Engineを組み込んで社内文書検索を実装した際に、日本語検索精度が低下するハマりポイントを報告した記事。text-embedding-005の非対称タスクタイプ設定ミスが原因で、text-multilingual-embedding-002への変更で解消した。
Tier 2
ElevenLabs Music v2 APIのcomposition_planパラメーターを使って、曲をセクション単位で制御しながら生成する方法を試した記事。intro・verse・chorus・outroごとに歌詞・スタイル・長さを個別に指定できる。
Tier 3
CodexはカスタムHTTPヘッダーを直接渡せないため、mcp-remoteプロキシを中継してラッコキーワードMCPなどの独自ヘッダー認証に対応させる。設定時のシェルコマンド改行混入とタイムアウト問題への対処を解説。
Tier 3
Claude CodeのSessionStart HookでPowerShellスクリプトを自動実行し、ポリシーファイル群をコンテキストに注入。/clearしてもセッション開始時にポリシーが復元されるため、毎回の説明を省略できる。
Tier 3
ブラウザUIをクリック指定してAIに修正案を複数提示させるViteプラグイン。Shadow DOM隔離、Babel AST変換で要素ソース位置を特定、git worktreeで案を並列隔離して即座に見比べられる。
Tier 3
VS CodeサイドバーにClaudeCodeの実行状態を猫キャラで可視化する拡張機能。SessionStart・Stop、PreToolUse・PostToolUseフックをWebSocket経由で監視し、入力待ち・権限確認・完了時に異なる鳴き声で通知。
Tier 3
Claude Code本格運用書。セッション自動化・複数エージェント統制・トークン経済・障害パターンを網羅。全サンプルコードはビルド時に実行検証済み。
Tier 3
市販入門書の挫折を避け、目的・ペース・範囲を自分向けにカスタマイズした教科書をAIに執筆・監査させるループ。監査はCritical 0まで繰り返し、最終成果物は自分のコードの逆引き辞書として機能。
Tier 3
Claude Codeを記憶・自動化・コスト管理を備えた「第二の脳」として運用する全記録。社長モデル組織化、木構造知識階層化、Hook自動化、AI記憶システム、nightly パイプラインの実装で69%トークン削減。
Tier 3
PreToolUse HookでBash実行のたびに操作内容をJSONL形式で自動保存。STRIDE脅威モデルでRepudiation対策を優先実装。3週間で2,070件超のコマンドログが、作業パターン変化を可視化。
Tier 3
Anthropic公式frontend-design skillが『禁止リスト』から『自己批評工程』へ転換。設計リードの役割演じさせ、ブレスト→計画→批評→構築→再批評プロセス強制。シャネル引用『アクセサリー一つ外す』で装飾削減。
Tier 3
Anthropic研究『Agentic coding and persistent returns to expertise』の初学者向け読解。約40万セッション・23.5万ユーザー分析データが『計画70%人間・実行80%AI』『コード腕より対象分野熟練』『成功率28-33%非一発想定』を実証。
Tier 3
PROGRESS.md駆動で13Step開発をセッション跨ぎで継続。現在地・全ステップ一覧・申し送り事項の3セクション。セッション開始時『PROGRESS.md読んで→Step指示書実装』で文脈自動復帰。完了後『PROGRESS.md更新→コミット』で履歴記録。
Tier 3
長会話でAI応答が鈍化する原因はモデル性能でなくコンテキスト膨張。モデル階層化(力仕事は安い小型へ、良い鋼は判断に)と、50%で注意・70%で消費するコンテキスト管理で二重の節約。
Tier 3
AIコーディング道具の実効差は、モデル名でなく『どこで動き・何を読めて・何を実行させるか』の運用設計。ローカルCLI型vs クラウド/PR型で作業フロー根本相異。permission・repo instructionは安全装置でなく『依頼の設計契約』。
Tier 3
Claude CodeのfooterLinksRegexesはhttpのみ許可のため、localhost:27182エンドポイントでOS命令中継。ターン出力の絶対パスをクリック→正規表現マッチ→localhost HTTP→Python daemon→OS命令。
Tier 3
政府統計API(e-Stat)から人口データをDuckDB→SQLiteの二層で集計し、REST API公開。YAML駆動分析テーブル、基準年違いのシリーズ統合、国勢調査欠落を補間補正人口で埋める。FastAPI(開発)とPHP(本番)二重実装。
Tier 3
Snyk脆弱性スキャンが英語出力で読む気失せるため、Claude Code Skillにして日本語Markdown・HTMLレポート化。CVEに加えてClaudeが実コード追加調査し『攻撃シナリオ・影響・推奨対応』を記述。Free月100テストで個人開発無料利用可。
Tier 3
Claude Code auto modeは分類器がツール呼び出しのリスク判定し、安全なら自動承認・危険なら提示。–dangerously-skip-permissionsは全チェック無効化に対し、auto modeはプロンプトインジェクション対策・.git保護を維持。
Tier 3
Claude Code Skillでキーワード→記事执筆→メタデータ登録→Vercelデプロイ→Google Search Console登録まで半自動化。全自動でなく最後のトリガーだけ人手。キーワードカニバリ回避に複合ワード・内部リンク導線・既存加筆を優先。
Tier 3
Claude Code Dynamic Workflows(ultracode キーワード)は JavaScript で自動生成するサブエージェント大規模オーケストレーション。1回最大1000エージェント・同時最大16個を並列実行。中間結果はスクリプト変数に保持、Claude コンテキストには最終結果だけ返却。
Tier 3
Claude Opus 4.8が劣化疑惑を、モデル本体nerf vs 実効品質nerf に分離検証。Fable 5/Mythos 5停止後、Opus 4.8が代替先として案内される事例・公式障害・指示外作業・未検証完了・agent暴走報告をレイヤー毎に整理。
Tier 3
OpenCode+ローカルLLM(Google Gemma 4)で『無料Claude Code』を自作。環境構築と動作確認。
Tier 3
Claude Code・Codex の全社展開と AI 観測基盤の設計。エンタープライズ規模の導入戦略。
Tier 3
ReadMe.io から自社ホストへドキュメント移植を Claude Code で1日実現。Copilot CLIを使った自動化。
Tier 3
Codex 実践入門書。実装例・サンプルコード・運用ノウハウ集約。
Tier 3
FreeBSD jail 内で Codex CLI の device-auth がfailする問題と暫定回避策。環境固有の互換性問題解析。
Tier 3
Claude Code 分業フロー で3日30記事量産。AI分業による大量生成メソッド。
Tier 3
リポジトリ調査時の agent フロー設計。既存コード読まセ・再現・停止の段階。
Tier 3
Agent 時代に改めて押さえるソフトウェア工学ベストプラクティス。従来手法の再評価と AI 適応。
Tier 3
MCP増殖を避ける agent 工具箱の整理方針。ツール数上限と選別。
Tier 3
Agent 開発の反パターン10個。速さの代償を repo に払わせない実装。
Tier 3
AGENTS.md・_docs実装ログでトレーサビリティ確保。Agent 時代の規律。
Tier 3
AI Agent 手動プロンプトは終わり、loop 設計時代へ。自動化の次のステージ。
Tier 3
AI & データ release note まとめサイト構築。自動集約・整理の実装。
Tier 3
Claude Code と Codex を同条件で比較検証。両ツールの実効差分析。
Tier 3
ChatGPT を Planner、Codex を Executor にした開発 loop。分業フロー実装。
Tier 3
Codex hooks のハマりどころ6つ。再trust地獄の回避戦略。
Tier 3
Anthropic Dreaming を Codex hook で再現。context 増やさず精度向上。
Tier 2
aws loginコマンド(IAM Identity Center)でログイン後にCDK deployすると「No credentials configured」エラーになるケースと解消法を整理した記事。プロファイル名の扱いに落とし穴がある。
Tier 2
Amazon Timestreamのメモリストアの保持期間縮小がいつ反映されるかを確認したQ&A形式の短い記事。設定変更後に即時反映されず、バックグラウンドで順次データ削除が進む仕様を確認している。
Tier 2
Amazon WorkSpaces向けのシンクライアントアプリ「Amazon Quick」にMicrosoft Entra ID(旧Azure AD)をOIDCでSSO連携させた構成を検証した記事。IAM Identity CenterとEntra IDをフェデレーションする手順が中心。
Tier 2
EC2インスタンスのデバイスドライバー(PVドライバー)の仕組みを調査した記事。WindowsインスタンスがAWS独自の準仮想化ドライバーを使う理由・バージョン管理・更新方法を整理している。
Tier 2
ECS on Fargateで高解像度メトリクス(1秒間隔)をCloudWatchに送信し、Auto Scalingの反応速度を検証した記事。標準60秒集計との比較で、スパイクトラフィックへの応答時間がどれほど改善するかを実測している。
Tier 2
Bedrock Application Inference ProfilesをCloudWatchと組み合わせてコスト配賦と利用状況モニタリングを実現する構成を検証した記事。プロファイルごとにCloudWatchディメンションが分かれるため、チーム別・アプリケーション別の可視化が可能になる。
Tier 3
IruのWindows管理機能の限界と活用シーン。企業IT運用での実装検証。
Tier 3
Azure AI Foundry 2026年5-6月アップデート。開発者向け新機能を実務に落とす解説。
Tier 3
CSPM検知結果からAsanaタスク自動化時に、CloudTrail・AWS Config検索で作者特定。account-map(SSM Parameter Store)で個人/チーム共有アカウント分類。tag→account-map判定→CloudTrail検索の優先順位。
Tier 3
2026年にGoogle Workspaceで相次いで変更された機能(DBSC GA・AI control center・Workspace MCPサーバ・監査ログ拡張・CalendarDLP・iOS MDM拡充)を実務目線で整理した解説。多くの変更が管理者操作なしに既定有効となる点が特徴で、棚卸しなしに走り出すリスクを指摘している。
Tier 3
ランサムウェア『本当のコスト』は9か月後の決算で確定。アサヒ700億下方修正に学ぶ経営影響。
Tier 3
ノーコード自動化(iPaaS)に直書きされた秘密情報を LLM で一括検知。iPaaS セキュリティ脅威。
Tier 3
PM の AI 活用は文章生成より『論点の状態管理』に効く。メタ管理の威力。
Tier 3
削除済みデータ保存期間だけのはずが現役データ消失。Microsoft Purview retention policy の仕様読解。
Tier 3
Netskope R136〜R138(2026年初夏)の3リリースにわたる機能追加をSOC/IR・ゼロトラスト運用の観点で横断整理。AI統制・Advanced UEBA刷新・Enterprise Browserの深化・PQC基盤導入の4本柱が一貫して強化された期間となっている。
Tier 3
開発用 AI プロダクトの予算別おすすめ構成。コスト vs 機能 matrix。
Tier 3
セキュリティ製品導入して終わり対策。『お世話会』メソッドでの継続運用。
Tier 3
AI 時代の競争力は『モデル選び』でなく『学習 loop 所有』。Nadella 氏論を読解。
Tier 3
Zoom OAuth → Cloudflare 502 瞬発。監視鳴る が DLQ が救った インシデント分析。
Tier 3
情報システムの価値を壊すセキュリティは悪である。security usability trade-off の議論。
Tier 3
Claude Fable 5 とは。公開3日で米政府停止の全真相。いつ再利用できるか。
Tier 3
Notion AI マスターコース。Notion Agent・Custom Agent・Worker 全解説。
Tier 3
AI コーディング時代の『セキュリティの民主化』。初心者の脆弱性混入防止。
Tier 3
Microsoft 365 Copilot 新機能: Copilot Cowork で Claude Fable 5 (preview) 利用。統合手順と注意点。
Tier 3
上司の『思考の型』を AI 壁打ちにして PM 力を鍛える。メンタルモデル伝承。
Tier 3
推論モデルとは何か。AI が『考えるようになった』と言われる理由。
Tier 3
Notion AI で Anthropic model が一時無効化された件を整理。原因・期間・workaround。
Tier 3
決算チェックを AI に任せて分かった入力の工夫。精度向上の data 品質対策。
Tier 3
AI 時代の業務基盤は『モデル選び』でなく『AI に渡せる業務コンテキスト』で決まる。
Tier 3
AI バイオセキュリティから考える『速すぎる AI の統制点』。dual-use の制御。
Tier 3
Anthropic Defending Code Reference Harness を読む。AI に脆弱性対応を任せる前に。
Tier 3
AI 使うのが上手い人は『プロンプト』ではなく『進め方』を設計している。workflow design。
Tier 3
Asana Agentic Work Management をクラウドネイティブ日次レポート運用から考える。
Tier 3
Claude Code・Codex 両方に存在する /goal 機能。違いはあるのか。
Tier 3
CrowdStrike SGNL 買収($740M)。AI agent 時代の『Continuous Identity』が変えるゼロトラスト認可。
Tier 3
業務委託・パートナー混在の ABAC 実装。Okta×Jamf/Intune×EDR 統合。
Tier 3
ランサムウェア前提 BCP をどう書くか。IPA 机上演習教材を自社用にデチューン。
Tier 3
NIST IR 8286 Rev.1 を読む。サイバーリスク を経営判断に繋げるための情シス work。
Tier 3
なぜ Web サービスには SSO・MFA が実装されないのか。市場適合性(field fit)の問題。
Tier 3
全体最適の罠を避けるには。情シスが小さく進める設計と実行。
Tier 3
2026年の今なぜ SSO が重要なのか。企業のアイデンティティ基盤の地位向上。
Tier 3
Box Automate 触ってみた~Enterprise Plus 版~。ノーコード自動化の機能確認。
Tier 3
Okta ITP × Universal Logout 完全活用ガイド 2026。対応 SaaS 拡大と採用判断。
Tier 3
Microsoft Build 2026 まとめ。AI がコンテキストの海を泳ぐ時代に業務基盤屋は何を考えるか。
Tier 3
Notion AI custom agents とは。料金・権限・運用設計【2026年6月最新】。
Tier 2
React useEffectのクリーンアップ関数とexhaustive-deps lintルールの動作を丁寧に整理した解説。クリーンアップが呼ばれるタイミング・依存配列との関係・よくあるバグパターンを一次体験で確認している。
Tier 2
ReactのonChangeハンドラがIME変換中(日本語入力の確定前)に発火してしまう問題と、compositionstart/compositionendイベントを使った正しい対処法を解説した記事。
Tier 2
React Hook Formのwatch()を使ってフォーム値の変更を検知し自動検索を実現する実装を深掘りした記事。subscribe/unsubscribeの仕組みと過剰なAPI呼び出しを防ぐdebounce適用の注意点を整理している。
Tier 2
Google Chat BotをCloud Runで動かす際にhttplib2のスレッドセーフ問題が原因で断続的にエラーが発生した事例と修正方法を紹介。共有インスタンスを排除してリクエストごとに生成する変更で解消した。
Tier 2
Google Chat BotのメッセージをCards V2形式でリッチなテキスト表現に変換する実装例を紹介した記事。TextParagraphウィジェットでHTMLタグが使えるため太字・斜体・リンクなどが可能になる。
Tier 2
AWS Amplify Hosting向けのコンテンツ検証ツール「Omni Content Validator」を試した記事。デプロイ前にHTMLの壊れリンク・メタタグ欠落・画像alt属性などを一括チェックできる。
今日の記事全体を見渡すと、Claude CodeとCodexを中心としたAIコーディングエコシステムの成熟が加速している。Tier 2(dev.classmethod.jp)からはClaude Code v2.1.182-183の具体的な機能改善(OTLPトークンのKeychain保管・/usageコマンドでのトークン可視化)が報告され、Tier 3(Zenn等)では運用の「型化」が大量に共有された。SessionStart HookによるポリシーAI自動注入、PROGRESS.md駆動のセッション継続、PreToolUseによるコマンドログ自動保存、Dynamic Workflowsによる最大1000エージェントオーケストレーションと、利用者側がツールの限界を押し広げる実装が次々と登場している。Claude Codeとの比較ではCodexも存在感を示しており、FreeBSD jail問題・hooksハマりポイント・ChatGPT-Planner/Codex-Executorパターンなど実用的な知見が蓄積されつつある。
「AIコーディングツールの差はモデル性能ではなく、どこで何を許すかに出る」という記事が象徴するように、AIツールの実効値を左右するのはツール選定ではなく運用設計だという認識が確立されつつある。Anthropicの約40万セッション分析(「計画70%人間・実行80%AI」「成功率28-33%を前提に設計する」)が実データでこれを裏付けている。また「AIを使うのが上手い人はプロンプトではなく進め方を設計している」というcloudnativeの記事も同方向を指しており、Claude Code Skillで半自動SEO記事量産・Claude Codeの「第二の脳」化(69%トークン削減)という実装事例が複数確認できた。
cloud,enterprise-it側では、セキュリティ分野のAI時代対応が複数の方向から進んでいる。Google WorkspaceのDBSC GA・AI control center(既定有効)、NetskopeのAdvanced UEBA再構成・Endpoint DLP 18ポリシー追加(既定有効)、CrowdStrikeによるSGNL買収($740M)でのContinuous Identity認可、OktaのITP×Universal Logout対応SaaS拡大と、管理者の設定変更なしに変わる機能が目立つ。既存設定の棚卸しなしに走ると予期せぬ影響が出るリスクがあり、Google Workspace記事が指摘する「棚卸しなしに走り出すリスク」はNetskope R138のEndpoint DLP既定有効にも同様に当てはまる。また「Anthropic Defending Code Reference Harness」記事が示すように、AIに脆弱性対応を任せる際の品質担保の仕組みも問われ始めている。
Bedrock Application Inference ProfilesのCloudWatchディメンション分離検証、Claude Code/Codexの全社展開と観測基盤設計(docswell)、「AI & データリリースノートまとめ」サイト構築など、AIエージェントをどう観察・管理するかが実務課題として前景化している。Claude Opus 4.8の「劣化疑惑」検証記事では、モデル本体のnerf(サービス側の調整)と実効品質のnerf(利用者側の体感)を分離して多層分析する試みが行われており、ベンダー提供のブラックボックスに対してユーザー側が独自の観測を持つ必要性が高まっている。