OpenAI社 o3に関する調査

2025年5月4日2025年5月8日

OpenAI社 o3（推論モデル）が使えるようになったが、4oや4o deep researchモードとの使い分けなど、不明な点も多いので調査した。

ChatGPT 4oと、ChatGPT 4o deep researchモードと、o3はどのように使い分けたらいいのですか

OpenAI o3の回答

（思考時間：19秒）
以下では、ふだんの使い分けがイメージしやすいように「特長 → 得意シーン → 向いていないシーン → 具体例」という順にまとめます。すべて同じチャット画面内で切り替えられますが、実際は“エンジンの性格”がかなり違います。

1. ChatGPT-4o（通常モード）

要素	内容
特長	会話やコード試作を“リアルタイム”で応答。画像・音声・ファイルも即座に扱える万能型。
得意シーン	– 下調べ前のアイデア出し – コードの雛形生成やデバッグ – ブレインストーミング、翻訳、簡易要約
向かないシーン	情報の一次ソース確認・網羅的調査を必要とする場面（後述のDeep Researchのほうが適任）
利用例	「Arduinoで温度ロガーを作るサンプルコードを書いて」 → その場で即返答し、何度も往復しながら修正

“4o はリアルタイムかつマルチモーダル対話向き” という公式説明

2. ChatGPT-4o Deep Research モード

要素	内容
特長	背景でo3系の研究用エンジンが約5〜30分かけて外部サイトを多数巡回し、出典付きで詳細レポートを生成。（補足）以前はChatGPT-4oをベースにしていたが、o3系の研究用エンジンをベースにするように変わったとのこと
得意シーン	– 医療・法律・学術など「裏取り」が必須の調査 – 市場・競合リサーチ、ホワイトペーパー下書き – 論点が複雑で一次情報を突き合わせたいケース
向かないシーン	締め切りが数分後の仕事／ラフな相談 ― 完全自動調査ゆえ待ち時間とクエリ上限がある（Plus=月10回など）
利用例	*「QZSS に関する最新の研究動向と主要論文を網羅し、各論文の弱点を整理して」* → 20分後に40〜60ページ相当のレポートが届く

Deep Research は“徹底調査用で、短い会話には通常4oの方が向く”と公式FAQで明示

3. OpenAI o3（推論モデル）

要素	内容
特長	数学・コード・論理パズルなど“思考の深さ”を最優先に最適化。外部検索を自動では行わず、代わりに数ステップ先までシミュレートしてから答える。
得意シーン	– 計算量解析、アルゴリズム設計、証明問題 – 複雑なバグの根本原因追及（スタックトレース解析など） – 図や表をアップして「このグラフを解説して」
向かないシーン	Web上の最新ニュースや統計の収集（自分で出典を当たる必要あり）
利用例	「非線形制御系の安定性をラプラス変換で示し、数値例も含めて」 → 複数式を展開しながら推論過程を提示

o3 は“当社最強の推論モデルで、視覚タスクや STEM に強い”とのリリース

まとめ：こんな使い分けが便利

まずは 4o で対話 ラフスケッチ・方針づくり・プロトタイピングは高速。
深掘りが必要なら o3 へバトンタッチ 算数・制御理論・難解なコード検証など“頭脳戦”を任せる。
正式な資料化前に Deep Research で裏取り 出典リストが欲しい長文レポートや、調査工数が大きいタスクは時間をかけて自動調査。
ハイブリッド例
- 4o でブログの骨子 → o3 で複雑な数式・アルゴリズム部分を精査 → Deep Research で統計データを集めて脚注付き記事に仕上げる。

回答の中に、「o3 は“当社最強の推論モデルで、視覚タスクや STEM に強い”とのリリース」という記述が含まれていますが、STEMとはなんですか

OpenAI o3の回答

STEM は Science（科学）、Technology（技術）、Engineering（工学）、Mathematics（数学）の頭文字を取った略語です。

教育や研究・産業の分野で「理系・技術系科目や職種」を総称するときに広く使われます。

4 つの要素のイメージ

領域	代表例	o3 が得意とされる理由（例）
Science（科学）	物理・化学・生物・地学	論理構造化が明確なため、定義や法則を絡めた説明・計算を一貫して行える
Technology（技術）	IT、AI、データサイエンス	コード生成・アルゴリズム設計・データ解析などを高速に推論できる
Engineering（工学）	回路設計、機械設計、制御理論	数式展開やシミュレーション手順を複数ステップ先まで読み解く能力が高い
Mathematics（数学）	代数、解析、統計、離散数学	証明問題や複雑な最適化計算で「中間過程」を丁寧に示しながら解答できる

どう応用されるか

プログラミングのバグ解析 スタックトレースとソースを入力 → 原因箇所を特定し修正案を提示
数理最適化 制約条件を箇条書き → 線形計画法や整数計画の具体的モデル式を生成
画像や図表の読み取り 回路図をアップロード → 信号フローや部品表を自動で構造化して説明
学術的ライティング支援 科学論文の下書きを与える → 数式の整合性チェックや図表の解説を補完

このように STEM＝理系の知識領域 全般で、高度な推論と一貫した説明を求められるタスクを得意としているのが o3 の特徴です。

o3のモードで、モンスターハンターワイルズの滋養エキスの入手について質問したところ、回答が表示される前に、「ウェブを検索しています」というような表示が出ていましたが、ウェブ検索は行われていたのですか

OpenAI o3の回答

おおよその動きは次のとおりです。

フェーズ	内部で起きていること（簡略化）	画面に出る可能性のある表示
1. プロンプト解析	o3 が質問内容を読み取り、「これは最新情報が必要か？」を判断します。	―
2. ブラウズ要否の決定	「ゲーム内アイテムのドロップ率＝発売後も大きく変動しない固定データ」と推定 → 自前知識で十分と判断。	「ウェブを検索しています…」のバナーが一瞬出ることがある ←実際は表示・非表示が繰り返されていた（点滅していた）
3. （必要なら）検索実行	最新パッチ情報などが必要だと判断した場合のみ、実際に web.run で検索 → 出典付き回答へ。	バナーが数秒以上残り、最終回答内に引用マークが付く
4. 推論・回答生成	検索しなかった場合は、o3 が内部知識と論理推論だけで完結。	―

なぜ「検索中」バナーが出たのに実際に検索していない？

UI の仕様 モデルが「検索が要るかも」と判断した時点でバナーを出すため、最終的に「やっぱり不要」となっても痕跡だけ残ります（1 秒未満で消えることも）。
高速ヘルスチェック ごく短い“空検索”で「該当ページなし」→内部知識で回答する、というケースもあります。ユーザー側からは実質検索していないのと同じに見えます。
o3 の優先順位 o3 は“まず深い推論”を試み、外部依存を最小限にする設計なので、固定ゲームデータの質問では検索をスキップしやすいです。

どう確認できる？

回答中に「」のような脚注が付いていれば、実際に web 検索結果（またはニュース API 等）を参照しています。
脚注が無い場合は、ブラウズは行われず内部知識だけで答えています。

まとめ

「検索中」バナーが見えた＝必ず外部検索をした ではありません。
o3 は検索要否を瞬時に判断し、不要と判断した場合はそのまま自前の推論エンジンだけで回答を組み立てます。

もし「最新パッチ（例：2025年5月2日ver X.X）でのドロップ率変更が気になるから、必ず公式パッチノートを参照してほしい」というように明示的に“最新情報必須”と伝えれば、モデルは確実にブラウズモードを実行し、出典付きで返します。

o3に使用回数制限はありますか。deep researchモードのように10回/月のような

OpenAI o3の回答

結論（先に要点）

o3 には「月◯回」ではなく「週あたりのメッセージ数」制限があります。
制限は契約プランごとに異なり、ChatGPT Plus / Team / Enterprise では 週 100 メッセージ が現行の標準。
ChatGPT Pro は事実上「ほぼ無制限」（ただし不正利用を検知すると一時ロック）。
Free（無償）プランは現時点で o3 を直接選択できず、代わりに o3-mini／o4-mini が低めの上限で使えます（例：o3-mini 50〜150 メッセージ/日）。
上限のリセットタイミングは 「最初に o3 を使った時刻から 7 日後 0:00 UTC」。
Deep Research のような 「月次 x 回」 カウント制とは仕組みが別です。

プラン別・最新上限（2025年5月時点）

プラン	o3 の上限	リセット周期	備考
Free	利用不可（o3-mini 等を低レートで提供）	―
Plus / Team / Enterprise	100 メッセージ／週	7 日ごと	300 msg/日 (o4-mini) も併用可能
Pro	公式には「事実上無制限」（内部的なソフト上限はあるが公開されず）	―	常に最優先キュー
Deep Research	標準版 10 タスク／月（Plus）ライト版 +15 タスク／月 ←標準版上限に達すると、自動的にライト版に変わるとの発表あり	30 日ごと	1タスク=長時間バックグラウンド処理

「メッセージ数＝1回の送信＋それに対する AI の応答」 が 1 カウントです。
スレッド内で o3 を連続使用すると、その都度 1 消費します。

仕組みの違いと実務的な選び方

モデル	カウント単位	主な制約	典型的な用途
o3	チャットメッセージ	週上限。即時応答。	コード検証、複雑な STEM 問題、画像解析など「深い推論」を短時間で欲しいとき
Deep Research	リサーチタスク	月上限。1回 5〜30分。	論文サーベイ、競合分析など「出典付きの長文レポート」が必要なとき

実務ヒント

日常の Q&A やコーディング支援 → o3（上限が週ごとなので「今日はもう使えない」という事態が起きにくい）。
←現在、ChatGPTのアプリで「新規チャット」を選択すると、自動的にo3が選択される
一次情報を集めて図表・脚注付きでまとめたい → Deep Research（使用回数が貴重なので計画的に）。
o3 の上限が足りなくなったら o4-mini（300 msg/日）を“予備エンジン”にすると詰まらない。

よくある誤解

「o3 も月10回？」
- いいえ。Deep Research だけがタスク回数制。o3 は週あたりメッセージ制。
「上限に達したら追加料金で増やせる？」
- 現状不可。リセットを待つか Pro プランへアップグレードするしかありません。
「上限は突然変わる？」
- サーバー容量に応じて増減することがあるため、Help Center記事で最新値を確認してください。

参考情報

OpenAI Help Center – o3 / o4-mini 使用上限
Deep Research FAQ – タスク上限

・ChatGPTアプリの「新規チャット」ではo3が選択される。←（追記）ChatGPT-4oに戻っていた
・ウェブ検索を行うかはo3に委ねられている。ウェブ検索を行って欲しい場合は明示的に指示する必要がある。
・ChatGPT-4o（通常モード）とDeep Research モードの利用例として、それぞれ、「Arduinoで温度ロガーを作るサンプルコード」、「QZSS に関する最新の研究動向」という利用例の回答があったが、驚くべきことにこれらは、下記の記事を作成するために自分が以前質問した内容だった。

1. ソーラーパネル出力電力測定（データロガー製作編）　
　2024年11月に、Arduinoでロガーを作るためのサンプルコードについて質問

2. みちびき（準天頂衛星システム）の災害・危機管理通報サービス
　2024年12月に、QZSS（準天頂衛星システム）について質問

最近、過去（すべての？）チャット履歴も参照して回答するようになったというニュースを見た記憶があったので質問してみた。

最近、会話の記憶要領は変わりましたか

OpenAI o3の回答

ざっくり結論

短期メモリ（＝同一スレッド内で読み返せるトークン数） 2025年4月の o-シリーズ刷新で o3／o4-mini の最大コンテキストが約20万トークンまで拡大しました。これは和文でざっと15〜20万字、400ページ超に相当します。
長期メモリ（＝別スレッドでも参照できる「記憶」機能） 2025年4月10日のアップデートで 「過去すべてのチャット履歴も参照して回答」 する方式に切り替わり、実質的に記憶容量が大幅増。Plus/Pro などに既に展開済みです。

何が変わったのか

項目	以前	現在 (2025年5月時点)	影響
コンテキスト上限(短期メモリ)	o3=o2 世代: 128k 付近 4o: 128k	o3/o4-mini: 200k 4o: 128k	同一スレッドで貼れるファイルやコード量が約1.5倍に
持ち越し記憶(長期メモリ)	ユーザーが頼んだ内容＋AIが自動抽出した少量の「Saved memories」のみ	Saved memories＋全チャット履歴（自動サマリ）	別スレッドでも好み・進行中プロジェクトをかなり覚えている
ユーザー操作	「覚えて」「忘れて」と指示設定で ON/OFF	〃＋「履歴も参照する/しない」切替が追加	不意に覚えられたくない場合は Temporary Chat が確実

具体的にどう感じるか

同じスレッド内で
- 大量のコードや論文 PDF を貼っても途中で「前の内容が切れました」となりにくい。←まだ容量は少ないのでは
別スレッドをまたいで
- 過去に伝えた PC 構成や“回答は日本語で”といった好みを、毎回書かなくても反映。←確かにPCの構成パーツを教えた
- 一方で 誤った思い込み が残るリスクもあるため、気になったら「○○は忘れて」と指示すると安全。
プライバシー管理
- Settings → Personalization → Memory で「Saved memories」と「Chat history」の参照を個別に切替可能。
- Temporary Chat を使えば、そのスレッドは一切記憶も学習もされません。

注意点・よくある誤解

20万トークン＝常に保存ではない UI 側の「スクロール重さ」対策で古い部分を自動折りたたむため、視覚的には途中から見えなくなることがありますが、内部では保持しています。
長期メモリは要審査 不適切・機微な個人情報は自動的に「記憶候補」から除外されるポリシーになっています。
モデル別差異 Freeプランで選べる o3-mini 系は同じ200kトークン仕様ですが、メモリ機能は段階的ロールアウトなので利用できないケースがあります。

まとめ

短期は「1スレッドあたり最大 20万トークン」へ拡張、長期は「全履歴＋任意メモ」方式へ刷新――2025年4月のアップデート以降、ChatGPT の“記憶要領”は両面で明確に増えています。

使う側としては、便利さとプライバシーを天秤にかけつつ、設定と「忘れて」コマンドで調整するのがベストです。