AI検索の仕組み・RAGとquery fan-out

AI検索はどう動いているのか

ChatGPTやGoogleのAI Overviewsは、モデルの記憶だけで答えるのではなく、その場でWebページを取得して要約・引用するRAG(検索拡張生成)を土台に動きます。Googleも、AI OverviewsとAI ModeがRAGとquery fan-outで検索インデックスから情報を取得すると公式に述べています(Search Engine Journal, 2026)。

ここで効いてくるのが、取得されることと引用されることは別段階だという点です。取得されなければ土俵に上がれず、取得されても「答えに使う価値あり」と判断されなければ引用されません。

引用までの4段階

AI検索は、おおまかに次の4段階で進みます。

Query fan-out(クエリ分解): ユーザーの1つの問いを、複数の小さなサブクエリに分解する。
Retrieval(取得): 各サブクエリで候補ページを広めに集める。最終的に引用する数より多くを取りに行く。
Reranking(並べ替え): 集めた候補を、関連性や品質で順位付けする。
Synthesis & Citation(合成・引用): 複数ソースを1つの回答にまとめ、ごく一部だけを引用として付す。

query fan-out は単一クエリを複数のサブクエリに展開して並行実行し、複数文書から情報を集約して1つの回答にまとめる手法です。Google AI Mode、ChatGPT、Perplexity、Microsoft Copilot はいずれもRAGを土台にした近い構造を採っています。

なぜ取得されただけでは足りないのか

第4段階で実際に引用されるのは、取得した候補のごく一部だからです。並んだ候補の中から選ばれて初めて引用されます。

SIGIR 2026採択の査読研究「What Gets Cited」(Sprinklr、6つのLLM・252,000試行)は、2つの候補を注入する統制実験で、引用されるかどうかを最も左右するのはトピック適合と回答内の掲載位置だと報告しています(arXiv:2605.25517)。価格情報や新しいタイムスタンプも一貫して引用を増やす一方、書式だけの編集はほとんど効きませんでした。リランキングの段では権威性も働きます。Perplexityは引用を常に付し、権威あるドメインを選好する傾向が指摘されています。

どの段でも勝つには

打ち手は段ごとに分けて考えます。取得の段では、クローラーに読まれる土台を整えます。多くのAIクローラーはJavaScriptを実行しないため、本文を初期HTMLに含めるSSR/SSGが前提になります。並べ替えと引用の段では、トピックを外さず、結論を冒頭に置き、出典つきの具体を入れることが効きます。Kevin Indig の120万件のChatGPT回答分析では、引用の44.2%がコンテンツの最初の30%から取られていました(Search Engine Land, 2026)。エンジンごとの仕組みの違いはGoogle AI Overviewsの仕組みやPerplexityに引用されるにはで、構成全体の作り方はLLMに読まれ引用される記事構成で扱います。

参考文献

Search Engine Journal「Google's New AI Search Guide Calls AEO And GEO Still SEO」2026 https://www.searchenginejournal.com/googles-new-ai-search-guide-calls-aeo-and-geo-still-seo/575026/
Vishwakarma et al.「What Gets Cited: Competitive GEO in AI Answer Engines」SIGIR 2026 https://arxiv.org/abs/2605.25517
Search Engine Land「ChatGPT citations content study」2026 https://searchengineland.com/chatgpt-citations-content-study-469483