下記のYouTube動画で”Google Agent”が取り上げられ、Gemini 3 Proがユーザーの代わりに処理を行う様子が紹介されていた。Agentなので、注文するとか予約するとかの処理まで行ってくれるわけだが、最初に条件を聞かれて、最適解、または、複数の解候補のみが提示されて判断(支払い)を迫られるような気がするので、散策してウインドウショッピングする楽しみもある程度はユーザーに残しておいてほしいと思う。そういう理由もありAgentにそこまで代行させたくはないのだが、どのような処理を頼めるか(どこまでやってくれるのか)については興味があるので調査を行った。
ただし、Google Agentは日本ではまだ利用できず、言語設定が「英語」の米国ユーザー(しかも 最上位の Google AI Ultra プラン加入者)しか利用できないので、Gemini 3 Proを使って手動で同様のことをどこまで行うことができるのかを調べたので紹介したい。
YouTube動画:Gemini 3 Pro is Here: How to Use AI Agents in Gemini
(注)本記事の内容は正確性を保証するものではない。
(2025年12月21日 追記)YouTube動画を追加しました。 https://youtu.be/83SioxGiNpg

Google Agentの概要
Gemini 3 Proのagentツールは、日本ではまだ使えないのですか
Gemini 3 Proの回答
結論から申し上げますと、「Gemini 3 Pro」というAIモデル自体は日本でも利用可能ですが、Googleアプリと連携してタスクを自動実行する「Gemini Agent(エージェント機能)」は、現時点では日本国内でまだ一般提供されていません。
「モデル」と「機能」で状況が異なるため、少しややこしい状況です。現在のステータスを整理して解説します。
1. Gemini Agent(エージェント機能)の状況
GoogleカレンダーやGmailと連携して「旅行の計画を立てて予約する」「メールを整理してタスク化する」といった自律的な動作を行う機能です。
- 日本での利用: 不可(まだ使えません)
- 現在の提供範囲: 米国(US)のみ、かつ言語設定が「英語」のユーザー限定
- 必要なプラン: 最上位の Google AI Ultra プラン(月額約36,400円)への加入が必要
- 見通し: Googleは「今後、他の地域と言語にも拡大する」としていますが、日本での具体的な開始日は未定です。
2. Gemini 3 Pro(AIモデル)の状況
推論能力が強化された最新の頭脳そのものです。こちらは日本でもすでに使えます。
- 日本での利用: 可能
- 利用方法:
- 無料版/Pro版共通: Geminiの基本モデルとして、あるいは「思考(Thinking)」モードなどを通じて利用可能です。
(※プランや利用環境により、一部機能に制限がある場合があります)。 - 開発者向け: Google AI StudioやVertex AIなどの開発環境経由であれば、日本からでもGemini 3 ProのAPIを利用してエージェント的なアプリを自作することは可能です。
- 無料版/Pro版共通: Geminiの基本モデルとして、あるいは「思考(Thinking)」モードなどを通じて利用可能です。
まとめ:日本で今できること・できないこと
| 機能・モデル | 日本での利用 | 詳細 |
| Gemini Agent (タスク自動実行ツール) | × 不可 | 米国かつ英語設定のUltra会員のみ先行提供中。 |
| Gemini 3 Pro (最新AIモデル) | ○ 可能 | チャットや推論能力の利用は可能です。 |
もし「Gemini Agent」を使いたい場合は、日本での正式リリースを待つ必要があります。一方で、単に「Gemini 3 Proの賢い回答を使いたい」だけであれば、すでにブラウザ版やアプリ版のGeminiで利用体験が可能になっているはずです。
Gemini 3 Proも、設定によってGoogleの各種サービス(GmailやGoogleドライブなど)とも何らかの連携ができるはずだが、上記の回答では、Gemini 3 Proの説明に「GoogleカレンダーやGmailと連携して」という記載がない。Geminiの場合、ユーザーが指摘しないと言及してくれない(調べてくれない)ところがあるように思われ、そこが短所のように思われる。
以降、canvasのツールを使えるようにして追加の質問を行った。
Gemini Agentについて詳しく教えてください。活用事例もお願いします
Gemini 3 Proの回答
「Gemini Agent(エージェント)」は、これまでの「会話するだけのAI」とは一線を画す、「自律的に考え、行動するAI」です。
その仕組みや、私たちの生活・仕事がどう変わるのかという具体的な活用事例をまとめたガイドを作成しました。
こちらをご覧ください。
(以下はcanvas画面に表示されたガイド(Gemini_Agent_Guide.md)の内容)
Gemini Agent 完全ガイド:仕組みと活用事例
1. Gemini Agent とは?
これまでのAI(チャットボット)は、ユーザーの質問に「答える」ことが主な役割でした。対してGemini Agentは、ユーザーのゴール(目的)を理解し、そこに至るまでの「計画を立て」、「ツールを使いこなし」、「実行する」ことができる機能です。
「チャットボット」と「エージェント」の決定的な違い
| 特徴 | 従来のGemini (チャットボット) | Gemini Agent (エージェント) |
| 役割 | 相談相手、情報検索 | 専属秘書、実行部隊 |
| 動作 | ユーザーが1つずつ指示を出す | AIが自律的に手順を考えて動く |
| 外部連携 | 限定的 (検索して要約など) | 広範で深い (予約、購入、操作、別アプリの起動) |
| 記憶 | 会話の流れを記憶 | ユーザーの好みや過去の文脈を深く理解 |
2. Gemini Agent の仕組み:どうやって動いている?
Gemini Agentは、人間の「思考プロセス」を模倣してタスクを処理します。
- 推論 (Reasoning): 「来月の連休に家族で沖縄に行きたい」と言われたら、「フライト検索」「ホテル予約」「子供向けアクティビティ調査」「レストラン予約」が必要だと分解して考えます。
- 計画 (Planning): どの順番で実行するのが効率的かスケジュールを組み立てます。
- ツール使用 (Tool Use): Googleフライト、Googleマップ、Gmail、カレンダーなどのツールを実際に操作し、情報を取得・処理します。
- 実行と修正 (Execution & Refinement): もし希望のホテルが満室なら、条件に近い別のホテルを自律的に探し直して提案します。
3. 具体的な活用事例 (ユースケース)
Gemini Agentが実装されると、以下のようなシナリオが現実になります。
【事例1:旅行計画の丸投げ】 (プライベート)
ユーザーの指示:
「来月の第2週末、予算20万円以内で、妻と二人で京都に行きたい。静かな旅館に泊まって、美味しい懐石料理を食べたいな。新幹線の時間も含めてプランを立てて。」
Gemini Agentの動き:
- Googleカレンダーを確認: 第2週末の空き状況を確認。
- 検索・比較: トラベルサイトやGoogleフライト/ホテルと連携し、予算内で評価の高い「静かな旅館」をリストアップ。
- 予約代行 (または準備): ユーザーが「これでOK」と言えば、宿泊予約画面への入力補助や、新幹線のチケット手配画面まで誘導(または完了)します。
- 旅のしおり作成: 旅館の場所、移動時間、周辺の観光スポットをまとめた旅程表を作成し、スマホに送ります。
【事例2:メール整理とタスク自動化】 (ビジネス)
ユーザーの指示:
「今週届いた『請求書』という件名のメールを全部探して、添付のPDFをDriveの『経理2025』フォルダに保存して。あと、請求金額をスプレッドシートにまとめておいて。」
Gemini Agentの動き:
- Gmail検索: 条件に合うメールを抽出。
- ファイル操作: 添付ファイルを抽出し、指定のGoogle Driveフォルダへ保存。
- 視覚認識・データ抽出: PDFの中身を読み取り(OCR)、請求金額と会社名を特定。
- シート作成: Googleスプレッドシートを新規作成(または追記)し、データを入力して完了報告します。
【事例3:ショッピング・探しもの】 (日常)
ユーザーの指示:
「このインスタの写真(画像をアップロード)に写っているような、青いスニーカーを探して。サイズは27cmで、安く買える店を知りたい。」
Gemini Agentの動き:
- 画像認識: 画像からスニーカーの特徴(ブランド、モデル、色)を解析。
- ショッピング検索: 複数のECサイトを横断検索し、在庫があり、かつ価格が安い順にリストアップ。
- 購入支援: 配送予定日も含めて提案し、カートに入れる手前までサポートします。
【事例4:情報収集とレポート作成】 (学習・調査)
ユーザーの指示:
「生成AIの最新の法的規制について、日本、EU、アメリカの動向を比較してまとめて。」
Gemini Agentの動き:
- 多角的リサーチ: 信頼できるニュースソースや政府発表資料をウェブ全体から検索(Deep Research)。
- 情報の統合: 各国の情報を読み込み、共通点と相違点を分析。
- ドキュメント作成: Googleドキュメントに見出し付きのレポートとして執筆し、「ドラフトができました」と提示します。
4. 日本での提供が待たれる理由
これらの機能は、単に便利なだけでなく、私たちが「PCやスマホを操作する時間」を劇的に減らしてくれます。
アプリを切り替えてコピペしたり、検索結果をいくつも開いて見比べたりする作業をAIが代行してくれるため、人間は「最終決定」をするだけで良くなるのです。
現在は米国・英語環境での先行提供ですが、日本で利用可能になれば、毎日の仕事や生活のスタイルが大きく変わるでしょう。
【事例1:旅行計画の丸投げ】の事例は、Googleカレンダーも考慮してくれ、土地勘のない場所での旅館探しにはありがたい。自分で見つけた旅館候補を加えて比較評価させれば実用的なレベルになるという事例。
【事例2:メール整理とタスク自動化】の事例は、Gmail検索、添付PDFの処理(ファイル操作・視覚認識・データ抽出)、まとめシート作成まで行うという超強力な活用事例で、一部を手動で行ってもかなり時短になる事例。
【事例3:ショッピング・探しもの】の事例では、在庫の確認や配送予定日を調べてくれるのが優秀。Gemini 3 Proではここまでできないような事例。
【事例4:情報収集とレポート作成】の事例に関しては、Deep Researchを使っているところが興味深い。Deep Researchについては、思ったほど詳細な回答が得られない場合があるという印象があったので、あまり使用しておらず、使い所を明確に意識していなかったが、やはり、この事例のような多角的リサーチが必要な用途では使うようなので活用したい。
canvas画面を開いた状態で、チャット画面で追加の質問を行った。
Gemini Agentのツールは日本ではまだ使えないですが、同様のことを、Gemini 3 Proを使ってユーザーが手動で行えないかを検討したいと思います。
回答してもらった「決定的な違い」の表を確認したところ、処理をユーザーに代わって実行するかどうかという点と、自律的に手順を考えるという点が違うようですので、下記の処理案のようにするのはどうでしょうか。各事例について実現可能性を回答し、canvasの内容に追加してください。また、ある程度実現可能ならその手順も追加してください。
<処理案>
Gemini 3 Proに、処理したい内容を伝え、Gemini 3 Proとユーザーのそれぞれが処理する内容及び手順を考えてもらう。
Gemini 3 Proが回答した内容及び手順に基づき、Gemini 3 Proへの指示や、ユーザー実施事項を処理する。
Gemini 3 Proの回答
ご提案いただいた「Gemini 3 Proを司令塔(脳)とし、ユーザーを実行部隊(手足)とする」というアプローチは、非常に理にかなっています。
現状のGemini 3 Proは高い推論能力を持っているため、「何をすべきか」の判断や「情報の整理」はエージェント同様にこなせます。足りない「実行(クリックやファイル操作)」の部分を人間が補うことで、今すぐ疑似的にエージェント体験が可能です。
ご依頼の通り、各事例における実現可能性と、具体的な手順(プロンプト例)を追記しました。
特に「ビジネス(メール処理)」の事例では、直接アクセスできない制限をどう回避するかがポイントになります。
Markdownファイルを更新しましたのでご確認ください。
(以下の内容がcavas画面に表示されたガイド(Gemini_Agent_Guide.md)に追加された)
5. 日本で今すぐ実践!Gemini 3 Proを使った「疑似エージェント」運用
Gemini Agent(自動化機能)が使えない現在でも、Gemini 3 Proの高度な推論能力を活用し、「Geminiが計画・指示」→「ユーザーが実行」という役割分担を行うことで、エージェントに近い成果を得ることができます。
基本戦略:
Geminiに「あなたは旅行代理店のエージェントです」「あなたは秘書です」と役割を与え、「私は実行部隊として動くので、具体的な手順と必要な情報を提示してください」と依頼します。
各事例の実現可能性と実践手順
【事例1:旅行計画】(実現可能性:高)
Geminiは予約ボタンを押せませんが、「空室状況の確認が必要な宿リスト」や「最適な移動ルート」の提示は完璧にこなせます。
- 手順:
- 指示: 「京都旅行の計画を立てて。条件は〇〇。宿は候補を3つURL付きで挙げて。移動ルートも決めて。」
- Gemini: プラン作成、宿の候補(予約サイトのリンク等)を提示。
- ユーザー(実行): 提示されたリンクから予約を行う。
- 仕上げ: 「予約完了。これを『旅のしおり』としてまとめて」と依頼し、Geminiにテキストを作成させる。
【事例2:メール整理・データ化】(実現可能性:中)
Geminiはユーザーの非公開メールボックスやローカルフォルダを直接操作できません。ユーザーが「コピペ」で情報を渡す必要があります。
- 手順:
- 準備: 対象のメール本文やPDFの内容をコピーする。
- 指示: 「以下のテキストは請求書データです。ここから『日付』『会社名』『金額』を抽出し、Excelに貼り付けられる表形式(CSV形式)で出力して。」→ テキストをペースト。
- Gemini: データを構造化して表を作成。
- ユーザー(実行): 表をコピーし、スプレッドシートに貼り付け。PDFは手動でフォルダへ移動。
【事例3:ショッピング】(実現可能性:高)
画像認識と検索能力は現在でも利用可能です。購入の最終クリックだけユーザーが行います。
- 手順:
- 指示: 画像をアップロードし、「このスニーカーの商品名と、日本で27cmが買えるECサイトのリンクを探して」と依頼。
- Gemini: 画像から商品を特定し、在庫がありそうなショップのリンクを提示。
- ユーザー(実行): リンク先で購入手続きを行う。
【事例4:レポート作成】(実現可能性:非常に高)
これは現在のGeminiが最も得意とする分野です。「調査」から「執筆」までほぼ自動化できます。
- 手順:
- 指示: 「〇〇について調査し、レポート構成案を作成して。OKを出したら執筆に進んで。」
- Gemini: 構成案を提示。
- ユーザー(確認): 「構成OK。執筆して」と指示。
- Gemini: 全文を執筆。
- ユーザー(実行): 文面をドキュメントアプリにコピペして保存。
Gemini 3 Proとユーザーの役割分担を行うという前提条件のもと、それらを明確に区別した適切な回答が得られた。
つまり、その前提条件の下で、ユーザーへの指示事項と、Gemini 3 Proへの指示要領という形式で回答が得られている。
4つの事例の場合、役割分担を行うということがすでに決まっているので、それを前提とした具体的な手順が回答されているが、一般的には、まず、下記のような指示を与える必要がある。
・「あなたは〇〇です。私はあなたができないことを実行する実行部隊として動くので、〇〇という目的を達成するための具体的な手順と必要な情報を提示してください」
・「〇〇の目的のために必要なタスクを全てリストアップし、Gemini 3 Proとユーザーとで役割分担してそれらのタスクを実行できるように、Gemini 3 Proが実行できる部分と、ユーザーが行う部分を明確に区別して手順を教えてください」
ただし、事例2の場合、Geminiは設定によってGmailとも連携できるはずだと思ったので、その点を質問した。
Geminiには各種のGoogleアプリと連携する設定があり、Gmailとも連携できたと思います。その連携が可能なら、メールがGmailの場合と別のメールサービスとの場合を分けて回答してください。その回答に基づいてcanvasの事例2の内容を修正してください
Gemini 3 Proの回答
ご指摘の通りです。Geminiには「Google Workspace 拡張機能」があり、これをオンにすることで、日本のユーザーでもGmail、Googleドライブ、Googleドキュメントの中身をGeminiに検索・参照させることが可能です。
(補足) 「設定」の「アプリ連携」で、「Google Workspace」をオンにすれば使える機能のこと。
この機能を使えば、Gmailユーザーは「コピペ」の手間を大幅に省けます。
一方で、OutlookやYahoo!メールなどの他社サービス、あるいは拡張機能をオフにしている場合は、引き続き手動での連携が必要です。
この違いを踏まえ、Gmail(拡張機能あり)の場合と、その他のメールの場合に分けて、Canvasの【事例2】を修正・更新します。
Gmail連携の有無による違い
- Gmail(拡張機能 ON)の場合
- できること: 「◯◯からのメールを探して」「今週の請求書の金額を教えて」といった指示だけで、Geminiがメールボックス内を検索し、内容を読み取ってくれます。
- できないこと(手動が必要): 添付ファイルを自動でDriveに保存したり、メールを削除・移動したりする「操作」はまだできません。
また、スプレッドシートへの「追記」も直接はできないため、作成された表をコピー(またはエクスポート)する必要があります。
- その他のメール(Outlookなど)の場合
- 手順: Geminiは外部のメールボックスに入れないため、ユーザーがメール本文をコピーして貼り付けるか、PDFをアップロードして読み込ませる必要があります。
この内容を反映し、Canvas内の「事例2」をより実践的な手順に書き換えました。
(下記のように、『5. 日本で今すぐ実践!Gemini 3 Proを使った「疑似エージェント」運用』の事例2が書き換えられた)
【事例2:メール整理・データ化】(実現可能性:中)
利用しているメールサービスによって、Geminiの関与できる範囲が異なります。
(A) Gmailを利用している場合(Google Workspace 拡張機能をON)
拡張機能により、Geminiが直接メールボックスを検索・閲覧できるため、コピペの手間が省けます。
- 手順:
- 指示: 「@gmail 今週届いた『請求書』という件名のメールを探して、その中から『日付』『会社名』『金額』を抽出して表にまとめて。」
- Gemini: メールを検索し、内容を読み取って表を作成して提示。
- ユーザー(実行):
- 作成された表をスプレッドシートに書き出し(またはコピペ)。
- メールのリンクから添付PDFを開き、手動でDriveへ保存。
(B) その他のメールサービス(Outlookなど)の場合
Geminiは直接アクセスできないため、ユーザーが情報を渡す必要があります。
- 手順:
- 準備: 対象のメール本文をコピーする(またはPDFを保存する)。
- 指示: 「以下のテキストは請求書データです。ここから必要な情報を抽出してCSV形式にして。」→ テキストをペースト(またはPDFをアップロード)。
- Gemini: データを構造化して表を作成。
- ユーザー(実行): 表をコピーしてExcel等に貼り付け。
Gemini 3 ProでGmail検索はできるようだが、添付PDFの処理はできないようだ。非常に残念。
調べたところ、Zapierなどを使えば、Gmail→PDF解析→集計の処理が可能で、Gmailで「条件に合うメール(本文/件名/送信者など)」を拾い、PDF添付を取り出して、PDF解析→Google Sheetsに行追加…のようなテンプレ連携が可能なようだ。
Gemini 3 Proが、拡張機能 ONを前提とした回答をしてこない場合は、それを指摘して回答を修正させる必要がある。
本記事の最初に紹介したYouTube動画では、Gmailから、契約しているサブスクの情報(支払い金額の情報を含む)をまとめさせるという事例が紹介されていた。このような事例は、添付ファイルの処理をユーザーが行うとしても、活用したい事例である。
