Gemini 3.5 Flash、エージェント性能と速度を両立

GoogleがGoogle I/O 2026でGemini 3.5 Flashを発表したことで、エージェントとして動くAIが「遅くて高い」という常識から外れ始めました。今回のGoogle I/O 2026ではGemini OmniやAndroid XRなど複数の発表が注目されましたが、開発者の間で最も話題になったのがGemini 3.5 Flashの性能向上です。

Gemini 2.0 Flashとの違い──速さの上に性能を積んだ

前世代のGemini 2.0 Flashはその応答速度で開発者に支持されていました。Gemini 3.5 Flashはそのスピードを維持しながら、エージェント性能を一段引き上げた位置づけです。複数ステップのタスク処理──ウェブ検索・情報の整理・文書の作成を一連の流れで実行する──が以前より安定して動くようになりました。

今回の発表で強調されたのは「マルチステップ推論」「ツール呼び出しの精度」「長い文脈の維持」の3点です。従来のFlashシリーズは高速な反面、複雑な指示の途中で脱線するケースがありました。3.5ではその指示追跡の精度が改善されています。

APIコストが下がると、何が変わるか

最も実務的な影響が出そうなのはAPI利用コストです。GoogleはGemini 3.5 Flashを「エージェントワークフロー向けの高コスパモデル」として位置づけており、Pro相当の推論品質をFlashクラスの価格帯で提供することを目指しています。

これが意味するのは、これまでProモデルを使わざるを得なかった処理をFlashに置き換えられる可能性です。AIアシスタントやカスタマーサポートボットの処理コストが下がれば、AI機能を搭載するサービスの採算ラインが変わります。コストを理由に避けていた「常時稼働型エージェント」が現実的な選択肢に近づきます。

GPT-4o miniやClaude Haikuとの競合軸

軽量・高速・低コストの枠では、OpenAIのGPT-4o miniやAnthropicのClaude Haikuが先行しています。Gemini 3.5 Flashはそこに正面から入っていく形です。ただし、GoogleはGoogle検索・Gmail・Google WorkspaceとのネイティブなAI統合という強みを持っています。単純なモデル性能だけでなく、既存プロダクトとのエコシステムで差別化を図る戦略は明確です。

現時点ではGoogle AI StudioとVertex AIでAPIが提供開始されており、一般ユーザー向けのGeminiアプリへの展開は順次行われる見込みです。