Google最新AI「Gemini 2.5 Pro」登場、”思考する”AIモデルで推論能力が大幅向上

Googleが2025年3月25日に発表した最新AIモデル「Gemini 2.5 Pro」は、同社が「最もインテリジェントなAIモデル」と称する新世代の大規模言語モデル(LLM)です。Gemini 2.5シリーズの最初のリリースとなる「Gemini 2.5 Pro Experimental」は、AIの人間評価ベンチマーク「LMArena」で大差をつけて首位を獲得し、特に推論能力とコード生成能力において飛躍的な進化を見せています。実験版ながらも、すでに「Google AI Studio」と「Gemini」アプリでGemini Advancedユーザー向けに提供が開始され、企業向けサービス「Vertex AI」への対応も間もなく予定されています。

「思考モデル」という新しいアプローチ

Gemini 2.5の最大の特徴は、「思考モデル(Thinking Model)」と呼ばれる新しいアプローチを採用している点です。従来のAIモデルがテキストを入力するとそのまま回答を返す「変換(変形)」作業に近かったのに対し、Gemini 2.5は応答する前に内部的な思考プロセスを経て推論を行います。

この「思考」プロセスにより、AIは情報を分析し、論理的な結論を導き出し、文脈やニュアンスを取り入れ、より正確で情報に基づいた決定を下すことができるようになりました。Googleはこれまでも強化学習やチェーン・オブ・ソート・プロンプティングなどの技術を通じて、AIの推論能力向上に取り組んできましたが、Gemini 2.5ではベースモデルを大幅に強化し、改良されたポストトレーニングを組み合わせることで、新たなレベルの性能を実現しています。

今後Googleは、すべてのモデルに思考能力を直接組み込むことで、より複雑な問題に対応し、より高性能でコンテキストを認識するエージェントをサポートしていく方針です。

ベンチマークで示された卓越した性能

Gemini 2.5 Pro Experimentalは、様々なベンチマークテストで優れた性能を示しています。特に、人間の知識と推論の最前線を捉えるように設計された「Humanity’s Last Exam」というデータセットでは、ツールを使用しないモデルの中で18.8%という最高スコアを達成しました。

これは、OpenAIの「o3-mini」の14%(テキストのみの評価)やAnthropicの「Claude 3.7 Sonnet」の8.9%を大きく上回る結果です。また、数学や科学のベンチマークである「GPQA」や「AIME 2025」でもリードを示しています。

LMArena(人間の好みを測定するAI評価プラットフォーム)では、Gemini 2.5 Pro Experimentalが大差をつけて首位を獲得しており、高品質のスタイルを備えた非常に有能なモデルであることを示しています。

以下は主要ベンチマークでの比較結果の一部です。

ベンチマークGemini 2.5 Pro ExperimentalOpenAI o3-mini HighOpenAI GPT-4.5Claude 3.7 Sonnet 64k
Humanity’s Last Exam (ツール未使用)18.8%14.0%6.4%8.9%

飛躍的に向上したコーディング能力

Gemini 2.5 Proは、コーディング能力においても大きな進歩を遂げています。視覚的に魅力的なWebアプリやエージェント型のコードアプリケーションの作成、コードの変換や編集に優れており、エージェントコード評価の業界標準である「SWE-Bench Verified」では、カスタムエージェント設定で63.8%のスコアを獲得しています。

Googleが公開したデモでは、Gemini 2.5 Proが1行のプロンプトから実行可能なコードを生成して、エンドレスランナーゲームやフラクタル可視化ツール、インタラクティブなアニメーションなどを数秒で作成する様子が紹介されています。

特に注目すべき点として、Googleの研究者であるFei Xia氏はGemini 2.5を使って、三段ケーキの簡単なスケッチを3Dプリント用ファイルに変換することに成功しています。

マルチモーダル性と広大なコンテキストウィンドウ

Gemini 2.5は、先代のGemini 2.0の特徴であるネイティブマルチモーダル性と長いコンテキストウィンドウを引き継いでいます。テキスト、音声、画像、動画、コードリポジトリ全体など、多様な情報源からの複雑な問題を理解し、処理することができます。

現在のGemini 2.5 Proは100万トークンのコンテキストウィンドウを持ち、近日中に200万トークンに拡張される予定です。これにより、膨大なデータセットを理解し、複数の情報源からの複雑な問題を処理することができます。

利用可能性と今後の展開

Gemini 2.5 Pro Experimentalは、「Google AI Studio」と「Gemini」アプリで月額2,900円(税込)のAdvancedプランユーザー向けに提供されています。また企業向けクラウドサービス「Vertex AI」にも近日中に対応予定とのことです。

Googleは今後数週間以内に価格体系や利用条件についてさらに詳細情報を発表するとしています。また、「Google Workspace」など他サービスへの統合も進行中です。

コメント

タイトルとURLをコピーしました