いろいろ調べるときにGoogle検索だけで無く、PerplexityなどAI検索を利用する機会も増えてきた。さらにしっかり調べようかなと思う時は、GeminiのDeep Researchを利用する機会も多い。
自分は現状、各種LLMサービスに課金はしていないのだが、最近はDeep Researchの無料枠も増えている印象がある。各社の比較やより良いプロンプトも探していく上で、とりあえず2025年7月頭での各社のDeep Researchを比較してみようかと思う。
調べるネタについて悩んでいたのだが、最近性格診断系が少し気になっていることもあり、Big-5やMBTIなど世の中どういう指標があるのか調べてみることにした。正直、調べるネタによっても結果はだいぶ変わるのだろうな、とは思っている。
はじめに
まず各社の比較をPerplexityにやらせてみた。答えそのままではなく少し加工している。
主要サービスの特徴比較
| サービス名 | 主な特徴・できること | 料金プラン・回数制限 | 無料プラン | 有料プラン例(個人) |
|---|---|---|---|---|
| ChatGPT(OpenAI) | ・最高水準の分析力(専門的な調査や戦略提言まで可能)・推論サマリーや出典リンクの透明性・段階的なリサーチタスク実行・Pythonツールや画像/PDF解析も対応・リアルタイムで調査ステップを可視化・ビジネス・学術用途にも最適 | Free: 5回/月(無料)Plus: 25回/月($20)Pro: 250回/月($200) | 5回/月(軽量版) | Plus: 25回/月($20)Pro: 250回/月($200) |
| Gemini(Google) | ・Google検索と連携し幅広い情報源にアクセス・高速処理(複雑な質問も15分以内で回答)・レポートやリンク集形式の出力・Google Docs連携やエクスポート機能・日本語など多言語対応・法人向けプランあり | 無料: 10回/月(基本リサーチのみ)Advanced Pro: ほぼ無制限(約3,400円/月) | 10回/月(基本リサーチ) | Advanced Pro: ほぼ無制限(約3,400円/月) |
| Perplexity | ・数百の検索クエリを自動実行し情報収集・画像/PDF含む多様な形式の情報解析・引用元明示の詳細レポート・無料でもDeep Research利用可・UIがシンプルで使いやすい | 無料プランあり(回数制限あり)Pro: 無制限($20/月) | 回数制限あり | Pro: 無制限($20/月) |
| Grok(xAI) | ・X(旧Twitter)の投稿も検索対象に含む・多様なWeb情報を横断的に収集・無料でも利用可能・速報性の高い話題に強み | 無料プランあり(詳細は要確認) | 回数制限あり(詳細未公表) | 詳細未公表 |
| Claude | 並列検索・外部連携・長時間調査 | 無料プランはない | 利用不可 | Pro: 上限あり($20/月) Max: 上限大幅増($100/月) |
まあ、それなりに正しいのではないかと思う。違うところがあったら、ごめんなさい。
Claudeについては最初出てこなくて、あとで加えて欲しいとPerplexityに頼んだ。まあ、無料枠が無いのが出てこなかった原因かもしれない。調べた時点で正しそうだったが、各サービスそれぞれ無料枠が徐々に増えているなど変化があるので、ぜひ利用する際はその時の状況を確認して欲しい。
まあ、今回は無料で使える分の比較ということもあり、ChatGPT、Gemini、Perplexity、Grokを比較することにする。ちなみにGrokは今更だが初めて触ってみた笑
プロンプト
まあ、ある程度、条件は揃えたいよね、ということで、以下のプロンプトを各サービスに与えた。例として与えてみる表については、事前にPerplexityの Web検索にBig-5とかFFS、MBTIなど知っているものを適当にいれて、他にも性格診断を教えて、という感じで入れてみた。ただ名前を知るだけならDeep Researchは必要ないかな、というところで、もっと詳しく根拠や応用まで調べてまとめてくれるかが、Deep Researchの比較ポイントになる。
以下などのような個人の性格や行動特性を分析する枠組みについて整理して教えてください。 | **名称** | **分類** | **主な特徴・因子/タイプ** | **主な用途・背景** | | --- | --- | --- | --- | | ビッグファイブ(Big-5) | 特性論 | 外向性、調和性、誠実性、神経症傾向、経験への開放性 | 心理学の基礎理論、研究、実務 | | FFS理論 | 特性論 | 凝縮性、受容性、弁別性、拡散性、保全性 | 組織・ビジネス現場での応用 | | 16PF(キャッテル) | 特性論 | 16の性格因子 | 心理アセスメント、臨床 | | MBTI | 類型論 | 16タイプ(4軸:E/I、S/N、T/F、J/P) | キャリア、自己理解、組織活用 | | 16Personalities | 類型論 | MBTIをベースにした16タイプ+独自要素 | Web診断、自己分析 | | エゴグラム(TEGなど) | その他 | 5つの自我状態(CP、NP、A、FC、AC) | 交流分析、自己分析、カウンセリング | 整理の方法としては、(1)学術的な根拠のあるもの、(2)ビジネスでよく利用されるもの(根拠もあるか)、といった分け方をベースにして欲しいです。 (1)学術的な根拠のあるもの、についてはベースとなる論文や検証や比較などもしている論文を調べて教えて欲しいです。できるだけ最新の論文などもベースに教えて欲しいです。 (2)ビジネスでよく利用されるもの、については、利用方法や金額、もともと根拠としているデータなどを教えて欲しいです。
各社の比較
各社の結果をそのまま載せるには場所を取りすぎるので…感想をメインで載せていこうと思う。あとまあ、ランダムな部分も多いが、プロンプトは載せているのでマネしてもらった方が最新データも加味してまとめてくれるはず。
ChatGPT
HEXACOなどこちらが出さなかった指標も調べてきてくれた。概念を広げるという意味では結構優秀な選択肢かもしれない。
本当にそれだけなのかはわからないが、情報源として出してきたのは22件。もうちょっと調べてくれてもいいのだが…笑 その分、結果はスッキリしていて読みやすい。約3800字
おそらくモデルはGPT-4o mini (料金の無料版より)。
Gemini
良くも悪くも、長い笑 めちゃくちゃ長い笑 約23500字。
方向性としては、こちらが支持した指標のみをカバー。その分、61件に見えるかなりの量の情報源から調査をしてくれて、結果をまとめてくれている。まあそれは長くなるよな、と納得。”Deep”と言われて納得できるレベル。
モデルはGemini 2.5 Flashのはず。
Geminiのウリとしては、さらに音声概要を作成したり、この結果をNotebookLMの方に放り込んで、概要を聞いたり深掘りしたりできること。まあそういう後処理を考えて、長めに文章を生成しているのかもしれない。
Perplexity
文献数は68件と最も多い。一方で回答は結構まとめられている。約2715字。
短いこともあり、若干レポートとしては情報が足りない印象。まあ詳細を知りたければ原本を当たってくれ。その分、ハルシネーションは少ないはず。というスタンスなのかもしれない。
Perplexityのウリは、リソースをわかりやすく制限できること。今回は特に指定したつもりなくWeb全般を指定したつもりだが、論文のみに絞ったり可能なことがPerplexityのウリだろう。また、無料版ではDeep Researchの際はモデルを選択できなかったが、有料版ではモデルも変更できるのではないかと思う。いまいち選べるモデルをわかっていないが…Gemini系を選ぶと長くなるのかもしれない…
Grok
今回初めて使ったので、正直使いこなせているかはわからない。レポート量は約8020字。文献数は29だが、他と違い”Key Citations”と書いてあるので29件の他にも調査してくれているのかもしれない。
印象としては意外と(失礼?)、こちらの指示をちゃんと守っている。特に他と比べて、各種指標を利用する際の料金について詳しく調べてまとめてくれたのはGrokだった。どこまでハルシネーションなしにまとめてくれているかまでは検証できていないが、確かにこちらの要求は「調べるのにいくらかかるの?無料版もあるの??」みたいなところなので、最後にGrokを見た印象論もあるかもしれないが、「あ、その観点忘れてたわ、でも大事。」と思わせてくれた。
比較表
有料版しか出来ず、のけものにしたClaudeに表は作ってもらった。いらない行は削っている。また少し手直しはしている。
ChatGPT、Gemini、Perplexity、Grokの比較表
| 項目 | ChatGPT | Gemini | Perplexity | Grok |
|---|---|---|---|---|
| 文字数 | 約3,800字 | 約23,500字 | 約2,715字 | 約8,020字 |
| 情報源数 | 22件 | 61件 | 68件(最多) | 29件(Key Citations) |
| 回答の特徴 | スッキリして読みやすい | 非常に詳細で長い | 簡潔にまとめられている | 指示を忠実に守る |
| 調査範囲 | HEXACOなど追加調査 | 指定された指標のみをカバー | 文献数は多いが情報は簡潔 | 料金情報まで詳しく調査 |
| 使用モデル | GPT-4o mini(無料版) | Gemini 2.5 Flash | モデル選択可能(有料版) | 不明 |
| 特徴的な機能 | - | 音声概要作成、NotebookLM連携 | 論文のみ検索等の制限機能 | - (知らないだけかも) |
はじめにPerplexityに作ってもらった表と行・列が逆になっているが…Perplexityの表と大きく印象は変わらなかったかも。自分でやってみたからということもあるが、各社の色を肌で感じることはできた。
まとめ
こうブログとしてまとめてみると、各社のDeep Researchで特徴があるな、と感じた。もし大事な内容を調べようと思った場合、1社ではなく各社試してみてもいいかなと思った。
個人的には普段Geminiをよく使っているが、概念的な抜け漏れを心配する際はChatGPTやGrokにも聞いた方がいいなと感じたのは収穫だった。今後たとえばさらに「Big-5」について調べようかと思った際は、”論文”に絞って調べたくもなると思う。その際はPerplexityで調べようかと思ったり。
とはいえ普段Geminiで使っているからなのだが、プロンプトに”論文で”などと指定することでソースは絞れる。各社もそうではあると思うので、工夫のしどころではあるのかもしれない。参考になるが、"Automation of Systematic Reviews with Large Language Models" こういう論文もあり、いわゆるシステマティックレビューをChatGPTで実行している研究もあるようだ。PDFをMarkdown化するところにはGeminiを利用していて、必ずしもChatGPTにこだわっているわけではなく、いろいろ比較した結果ChatGPTに落ち着いたのだろう。Deep Researchも各社側の工夫と、ユーザーのプロンプトの工夫で、まだまだ改善の余地が多い分野なのかもしれない。
ちなみに、今回調べた性格検査のうち、自分が気になる・今後深掘りしてみようかなと思っているものは、「Big-5」、「16PF」、「16Personalities」になる。この中では16Personalitiesがいわゆるビジネス系のサービスになるもので、無料で日本語でも診断可能。
以上。