200万トークンのコンテキストウィンドウ——長編小説8冊を同時に取り込めるほどの容量——が、2026年4月に発売されたGoogleのGemini 3.1 Ultraの標準機能として搭載され、従来の本番環境でのベンチマークを2倍に引き上げ、企業向けAI展開の新たな運用基準を確立した。一般提供されている競合モデルにこれを超えるものはない。
コンテキストウィンドウとは、セッション中における言語モデルの作業メモリである。トークン数が増えるほど、システムが同時に保持できる情報量も増える。2025年末にリリースされたGemini 2.0 Ultraのコンテキストは100万トークンだった。2026年3月に発売されたOpenAIのGPT-5は、標準の消費者向けプランで256,000トークンを提供している。200万トークンへの倍増は主に消費者向けの機能ではなく——200万トークンのプロンプトを書く個人はほとんどいない——法的ディスカバリー、医療記録の統合、ソフトウェアコードの監査、長文の財務分析などの企業ユースケースにとって実質的な意義を持ち、切り捨てなしに1回のセッションで完結できるタスクの範囲を広げる。
Gemini 3.1 Ultraは、テキスト・画像・音声・動画のすべてのモダリティをネイティブに同時処理する。これは、マルチモーダル入力を別々の処理ストリームとして扱っていた旧バージョンとは異なる設計上の選択だ。Googleが公開した社内ベンチマークによれば、このモデルは専門知識の推論テストであるMMLU Proで89.3点を記録しており、GPT-5の報告値87.1、AnthropicのClaude 4.6の88.5を上回っている。ただし、これら3つの数値はいずれも各社が2026年3月から4月にかけて公表した自社評価によるものであり、その点を踏まえて解釈する必要がある。
Googleのオープンウェイト型補完モデルGemma 4は、2026年4月10日時点でLMSYS Chatbot Arenaのオープンソースモデル部門において1位を獲得し、Eloレーティングは1,412——公開されているLMSYSリーダーボードによれば、MetaのLlama 4 Scoutの1,384を28ポイント上回った。コンプライアンスやレイテンシの理由でサードパーティAPIにデータを送ることができない企業にとって、Gemma 4は現在利用可能な最も強力なセルフホスティングの選択肢だ。
重要ポイント
- Google Gemini 3 Ultra: Gemini 3.
- Gemma 4: Gemini 3.
- agentic AI: Gemini 3.
- AI 2026: Gemini 3.
商業的な原動力となっているのはエージェント型AI——単に質問に答えるだけでなく、各ステップで人間の確認を必要とせずに、ソフトウェア環境全体にわたって複数ステップのタスクを自律的に計画・実行するシステム——だ。Bloomberg Intelligenceは2026年3月、世界の企業向けAIソフトウェア支出が2026年に2,970億ドルに達し、2025年比で41%増加すると予測した。Google CloudのAI収益は2025年第4四半期に前年同期比52%成長し、同四半期で123億ドルに達した(Alphabetの2月の決算発表より)——ただし、同期間に187億ドルを計上したMicrosoft AzureのAIサービス部門にはまだ及ばない。Gemini 3.1 UltraとGemma 4は、GoogleとMicrosoftの両社が2026年および2027年における企業向けAI導入の定義となるカテゴリと位置付けるエージェント層でのこの差を縮めるために明確に設計されている。
GoogleのDeepMindチームは、2026年4月にNatureに掲載された論文の中で、目指すべき能力を「ワークフローレベルでの積極的自律性」と表現し、真のエージェント型システムをチャットボットと区別する基準として、各ステップでユーザーの承認を必要とせずにブラウザを操作し、コードを実行し、ライブデータを取得し、サブエージェントに委任できる能力を挙げた。Gemini 3.1 Ultraのツール使用APIはこのアーキテクチャを念頭に構築されている。200万トークンのコンテキストウィンドウにより、これまでのモデルが必然的なコンテキスト損失を伴う別々のセッションに分割せざるを得なかった、数日にわたる調査プロジェクト・反復的なコードのリファクタリング・複数文書にまたがる法的レビューといった長期タスクチェーンを通じて、一貫した状態を維持することが可能になる。
Advertisement
OpenAIとAnthropicにとって、このローンチは競合ベンチマークをリセットするものだ。3月にリリースされたGPT-5は、ほとんどの企業向け評価でOpenAIに一時的にトップの座をもたらしていた。コンテキストウィンドウの差とマルチモーダルアーキテクチャの転換が比較の基準点を変えた。現実的な短期的影響は、大規模な顧客移行ではない——企業向けAI契約には実質的な切り替えコストが伴う——が、Google Cloudが新規展開において他の2社の後に評価される二次的な選択肢ではなく、最初に検討される有力な選択肢として機能するようになったことだ。その購買プロセスの変化は、大きなスケールで重要な意味を持つ。
エージェント型のナラティブに潜むリスクはガバナンスだ。ライブのソフトウェア環境全体で自律的にワークフローを実行するモデルは、アドバイザリーなチャットボットにはない障害モードをもたらす。特権文書を誤分類した法的ディスカバリーエージェントや、200ページのPDFにまたがる契約条件をコンテキストウィンドウが誤読したことで欠陥のある取引を実行した金融システムは、現行の規制枠組みでは責任の所在が明確に定められていない連鎖的な責任問題を生み出す。2025年8月に完全施行されたEU AI法は、特定のエージェント型展開を適合性評価が必要な高リスクシステムに分類しているが、執行メカニズムはまだ発展途上であり、自律型の複数ステップワークフローの監査は単一のAI出力のレビューよりも大幅に困難だ。企業の法務チームはこのギャップに注目し始めている。
次に注目すべき節目は、2026年5月20日に予定されているGoogle I/Oだ。同社はここで、Gemini 3.1 UltraをSearch・Workspace・Geminiアプリなどのコンシューマーフェーシングなプロダクトに統合するかどうかを発表すると見られている。そのロールアウトが発表されれば、200万トークンのコンテキストウィンドウが数億人のユーザーの前に置かれることになり、2027年に向けてメインストリームAIがどのようなものかという実質的な定義を確立することになる。