查询扇出、潜在意图与来源聚合

via https://ipullrank.com/ai-search-manual/query-fan-out

生成式搜索时代下对查询的重新思考

当搜索由确定性排序系统驱动时,查询是整个体验的重力中心。用户输入一个短语,搜索引擎尽最大努力将这些精确的词与倒排索引中的词项进行匹配。匹配到更多词项、且在更重要位置匹配到的文档,得分更高。从输入到输出,查询是静态的,它的角色也很直接:它是审视索引的唯一透镜。

这种架构是关键词优先、文档其次,你在 SEO 中所做的一切都反映了这种关系。你挑选一组值得排名的查询,然后优化你的页面以与这些查询对齐,整个游戏就是让那些文档成为与该字符串最相关、最权威的匹配。

生成式搜索已经使这种方法过时了。在这个新的检索与综合流程中,用户键入的查询并非系统用来收集信息的查询。相反,初始输入被视为一个高层级的提示,一个触发更广泛探索相关问题和潜在用户需求的线索。系统会分解查询,以多种形式重写它,生成推测性的后续问题,并将每个变体路由到不同的来源。返回的结果不是一个单一的排名列表,而是一组候选内容块,系统会对其进行重排序、过滤和编译,以形成综合答案。

这一变化的影响怎么强调都不为过。它意味着,匹配用户查询的字面词句已不再足以保证被检索到,更不用说被包含在最终答案中。真正的竞争现在发生在子查询层面。你的内容不仅需要与原始措辞相关,还需要与系统在其扩展阶段可能生成的一系列相关和相邻的意图相关。

让我们回到用户搜索“最佳半程马拉松训练计划”的例子。在旧范式中,搜索引擎会使用那个确切的字符串或接近的词法变体来对文档评分。在生成式范式中,这个单一的查询成为一棵扩展树的种子:

  • 按时间框架划分的训练计划
  • 装备清单
  • 伤病预防策略
  • 营养计划
  • 配速策略
  • 赛后恢复指南

系统不再寻找单一的完美匹配。它正在构建一个证据组合来构建答案,而原始查询只是该组合的一小部分。

更重要的是,随着 ChatGPT 更新到 5.2 模型,它现在会生成更长尾的查询并执行最小限度的扇出。这意味着营销人员需要确切知道客户想要什么,并提供相应的内容。由于生成的扇出变少,你需要涵盖所有那些内容,否则就不会被引用。

阶段 1 —— 查询扩展与潜在意图挖掘

从用户的初始查询词到系统完整的检索指令集,这个过程始于查询扩展。在这个阶段,系统拓宽其寻找内容的范围,旨在覆盖请求背后的显性和隐性需求。

查询扩展并非新事物。早期的搜索引擎使用同义词列表和词干提取来捕捉变体,但现代版本在性质上已截然不同。借助 LLM、嵌入和真实世界的行为数据,它能够生成远超表层变化的扩展内容。

让我们以锚定查询“最佳半程马拉松初学者训练计划”为例。

意图分类

第一步是意图分类,它通过对将被考虑的来源类型和内容格式施加约束,来影响后续的一切:系统判定这是一个体育与健身领域的信息型查询,具体属于跑步子领域。任务类型被识别为“计划/指南”,并带有隐含的比较元素(因为“最佳”意味着评估)。此内容的风险等级较低,但存在安全方面的考量(如伤病预防建议)。

槽位识别

接下来是槽位识别。槽位是系统期望填充的变量,以便生成有用的答案。其中一些是显性的。例如,“半程马拉松”限定了距离,“初学者”限定了受众群体。其他则是隐性的;在此查询中,系统可能还想知道可用的训练时间跨度、跑者当前的体能水平、年龄组以及目标(是完赛还是创造个人最好成绩)。这些槽位可能不会立刻全部被填充,但知道它们的存在使得系统能够搜索可以填充这些槽位的内容。

潜在意图投射

一旦槽位被映射,系统就进入潜在意图投射阶段。在此阶段,原始查询被嵌入到一个高维向量空间中,模型根据空间邻近度识别邻近的概念。对于此查询,这些邻近概念可能包括:

  • “16 周初学者训练计划”
  • “跑走结合法”
  • “跑者交叉训练”
  • “长跑装备清单”
  • “补水策略”
  • “如何避免胫骨骨膜炎”

这些概念并非随机生成,它们基于历史查询共现数据、点击流模式以及知识图谱链接。

例如,知识图谱可能将“半程马拉松”与“13.1 英里”、“热门赛事”、“按距离划分的训练计划”和“耐力运动营养”等实体连接起来。遍历这些连接为系统提供了新的探索角度。如果“半程马拉松”连接到“训练计划”和“伤病预防”,这些节点就可以成为它们自身扩展的种子。

重写与多样化

然后,系统会生成原始查询的重写和多样化版本。这些可能包括缩窄范围的变体(例如“针对 40 岁以上初学者的 12 周半程马拉松计划”)和格式变体(例如“可打印的初学者半程马拉松计划表”)。每次重写都旨在最大化找到可能与原始措辞不匹配但相关的相关内容块的机会。

推测性子问题

最后,模型会根据类似会话的模式添加推测性子问题。一个询问训练计划的用户,后面常常也会问:“半程马拉松训练最适合什么鞋?”或者“我每周应该跑多少英里?”将这些子问题预先纳入检索计划,使得系统能够为综合答案提前收集可能需要的材料。

到扩展阶段结束时,系统可能已经生成了十几个或更多的子查询,每个子查询覆盖问题空间中略有不同的方面。它们共同构成了比原始查询丰富得多的用户意图表示。

对于 GEO 而言,其后果是明确的:如果你只为精确查询生产内容,那么你只是在为扇出树的一个分支竞争。要成为生成式答案中的常客,你需要出现在许多分支中。这意味着要构建意图完整的主题中心,不仅要回答核心问题,还要处理系统可能生成的最常见、最有价值的扩展。这也意味着要从槽位覆盖的角度来思考你的主题,确保模型可能想要填充的那些变量在你的内容中以可提取且明确的方式呈现出来。

阶段 2 —— 子查询路由与扇出映射

一旦扩展阶段产生了一组子查询,系统的工作就从“寻找什么”转向“去哪里寻找”。这就是路由阶段,扇出地图在此刻变为可操作。每个子查询本身现在是一个小任务,系统必须决定哪个或哪些来源最能满足它,哪种模态最适合答案,以及将使用何种检索策略来获取它。

路由是现代生成式搜索架构真正开始与 SEO 从业者所习惯的模式产生分歧的地方。在传统搜索中,每个查询都去往同一个地方:网络索引。该索引可能补充了新闻垂直、图片垂直或本地商家数据库,但其逻辑仍然相对浅层。查询进行词法匹配,在单一类型的索引上评分,结果按排名顺序呈现。在生成式系统中,路由步骤是一个更加主动的决策过程,它将不同的来源视为信息收集装置中的不同传感器。

将子查询映射到来源

回到我们的半程马拉松例子,扩展阶段可能产生了如下子查询:

  • “16 周初学者半程马拉松训练计划”
  • “半程马拉松装备清单”
  • “跑者拉伸动作”
  • “半程马拉松训练每周跑多少英里”
  • “初学者半程马拉松营养指南”

这些子查询各自具有不同的信息特征。训练计划最可能以文本或表格形式呈现。装备清单可以是表格或结构化列表,可能附带产品图片。拉伸动作可能最适合视频,但系统可能选择先检索字幕,因为它们解析更快。关于里程的问题可能指向结构化知识库,其中训练计划已经以机器可读的格式索引。营养指南可能被导向经过审核的健康内容,并可能受到更严格的来源过滤。

在路由中,系统维护着一个内部映射,记录哪些来源类型最适合不同类别的查询。“计划”可能映射到长篇文本和结构化时间表;“清单”可能映射到列表文章和产品表格;“动作”可能映射到视频;“定义”可能映射到知识库。

查询类别首选来源类型首选格式/模态
计划教练博客、训练网站、专家撰写页面长篇文本、结构化时间表、表格
清单电商网站、产品评测网站、联盟博客列表文章、项目符号列表、产品对比表
动作教学平台、健身应用、YouTube 频道视频(带字幕)、分步指南
定义知识库、百科全书、政府或学术来源简洁的解释性文本、结构化定义

这些映射既来自模型的训练,也来自系统的性能数据——如果来自某种来源类型的过往检索,对于给定类别的查询,带来了更好的综合结果,那么该来源类型将获得优先。

模态作为检索目标

在此阶段,模态被视为检索规范的一部分,而不仅仅是返回文档的一个属性。如果系统判定‘跑者拉伸动作’应该用视频来回答,它将优先考虑视频存储库、针对视频优化的索引,甚至是第一方的教学档案。然而,系统通常更倾向于从字幕或隐藏式字幕开始,因为这使其能够以文本形式处理信息,同时保留引用或链接到原始视频的能力。

这种模态感知的路由意味着,如果你纯粹以视频形式创建的一段内容缺乏字幕,它可能永远不会被考虑(尽管谷歌的系统会自动生成这些字幕)。同样,如果 PDF 文件难以解析或被锁定在付费墙后,其中深藏的包含大量数据的表格可能会被跳过。路由逻辑正在寻找最有效、最可靠的方式来提取所需信息,这通常意味着偏爱那些易于分块和嵌入的格式。

检索策略与成本预算

但路由不仅关乎将查询匹配到来源,也关乎决定如何进行检索。某些子查询最适合使用 BM25 等稀疏检索方法,这类方法在匹配稀有、特定的词项方面表现出色。其他子查询则受益于使用嵌入的稠密检索,即使在措辞差异很大时也能捕捉语义相似性。混合检索策略结合了两种方法,对合并后的结果进行排序,以吸取各自的优势。

路由还存在成本维度。每次检索调用(无论是调用 API、向量数据库还是网络爬虫)都会消耗资源。因此,系统可能会根据子查询对最终答案的重要性来预算其检索调用。高优先级的子查询可能会从不同来源获得多次检索传递;而低优先级的子查询可能只会从最可能的来源获得一次传递。这在商业垂直领域中尤其重要,因为如果系统从多个付费 API 获取数据,检索成本会迅速累积。

跨领域示例:金融

考虑一个不同的种子查询:“2025 年最佳高收益储蓄账户”。其扩展可能产生如下子查询:

  • “Ally Bank 储蓄当前年化收益率”
  • “Marcus 储蓄账户最低存款额”
  • “FDIC 保险限额解释”
  • “如何比较高收益储蓄账户”

在此场景中,路由会将利率查询发送到金融数据 API,将最低存款要求发送到银行产品页面,将保险说明发送到政府或教育来源,并将比较逻辑发送到个人理财编辑网站。这些属于不同的来源类型,各有不同的检索方法和成本模型。

GEO 启示:匹配路由画像

从 GEO 角度来看,路由这一步创造或错失了大量机会。如果你的内容不符合系统对给定子查询所期望的模态,它可能从一开始就永远不会被检索到。这就是多模态并行的意义所在:如果你发布一个训练计划,它应该同时以叙述性文本、结构化表格、可下载文件以及理想的带字幕短视频等形式存在。这样,无论系统决定针对该子查询采用哪种模态,你都有一个相关的表示形式准备就绪。

这也意味着要考虑你的内容存放在哪里。如果针对某些子查询,路由逻辑偏向于来自 API 的结构化数据,那么考虑以 API 友好的格式公开你内容的部分信息。如果系统偏爱程序性内容的字幕,那么确保你的视频拥有高质量、带时间戳的字幕。你的内容越符合路由画像,它就越有可能在扇出树的多个分支中被检索到。

阶段 3 —— 为合成而选择

当系统完成子查询路由和检索时,它掌握的内容远远超过其能整合到答案中的量。扇出过程已经从多个来源和模态收集了材料,现在漏斗开始收窄。选择阶段是系统决定将哪些检索到的内容传递到合成层的环节。

这与传统意义上的网络排名是非常不同的问题。在旧模式中,你可能有一个前十名列表,胜者排在第一位。在生成式模型中,可能有几十甚至上百个相关的候选结果,但只有少数对于答案生成既有用又可用。

选择不仅关乎与子查询的相关性。还关乎一个片段是否适合被提取、重组和整合,而不会引入事实错误、格式问题或不连贯性。实际上,系统并非在对整个页面进行排序,而是在对信息的原子单元进行排序,且评分标准是为合成需求而非点击行为量身定制的。

可提取性作为第一道门槛

第一个主要筛选条件是可提取性。如果一个片段不能在不损失含义的情况下从其周围上下文中干净地分离出来,它对合成过程的价值就较低。这就是为什么范围清晰、标签明确的内容往往最能通过选择。在我们的半程马拉松例子中,一个带有“周”、“里程”和“备注”表头的表格化训练计划是立即可用的。而同样一份计划如果用长篇段落叙述,会迫使模型去解析和重构结构,增加了出错的风险。

这也是为什么在 HTML 中明确使用标题、列表标签和语义标记来标识的操作步骤、定义和事实列表,在选择中表现更好的原因。它们为模型提供了清晰的块边界,使其无需阅读整个页面就能更容易地理解该单元是关于什么内容的。

证据密度与信噪比

一旦可提取性确立,系统会考察证据密度,即有意义、可验证的信息占总词元的比例。一个给出清晰陈述、紧接着提供直接引用或支持数据的紧凑段落,比一个冗长、充满轶事、将事实埋没在叙述中的章节更有价值。

在我们的例子中,一个简洁的段落写道:“根据美国运动医学会的建议,大多数初学者应每周训练三到四天,长跑距离每周增加一英里。”这就是高密度的。它提供了具体建议,包含了进度细节,并引用了可信来源。相比之下,一段 400 字关于作者如何为自己第一次比赛训练的回忆,关键细节散落各处,则密度较低,更有可能被丢弃。换句话说,你可以跳过你祖母的人生故事,直接给我项目符号列表式的食谱!

范围清晰度与适用性

生成式系统对范围很敏感,因为它们试图构建一个不具误导性的答案。如果一个片段没有明确说明其成立的条件,就很难在最终答案中正确地放置它。像“此计划假设你目前能够不间断地跑三英里”这样的陈述极为有用,因为它定义了适用性。没有这一点,模型可能会冒险将该计划推荐给无法达到该基准的人,这可能成为安全问题。

范围清晰度在 YMYL(你的金钱或你的生命)领域尤其重要。以金融为例:对于“Marcus 储蓄账户最低存款额”这个子查询,一个写着“无最低存款额”但未指明日期或账户类型的页面,可能会被排除,而另一个写着“截至 2025 年 2 月,Goldman Sachs 旗下的 Marcus 对其高收益储蓄账户无最低存款额”的页面则胜出。后者在时间和产品类型上都明确了范围,降低了信息过时或过度泛化的风险。

权威性与佐证

系统还会权衡来源的可信度以及该信息被其他检索到的片段所佐证的程度。此处的权威性不仅限于域名级别的信任;它可以应用于作者或发布者级别。由认证教练编写的训练计划或由注册营养师撰写的营养指南,比匿名的博客文章更有分量。

佐证是一个微妙但重要的因素。如果三个独立的、可信的来源在具体的里程递增计划上达成一致,该计划更有可能通过选择。异常的主张如果来源可靠,仍然可能入选,但系统通常会偏好具有多个共识点的信息。

新鲜度与稳定性

时效性是另一个筛选条件,尤其对于事实可能发生变化的话题。在我们的例子中,半程马拉松训练的基本原则可能相对稳定,但针对特定赛事的建议、装备推荐和营养指南可能随时间推移而变化。一个明确标注了日期并显示有近期审核证据的片段,比没有时间标记的片段对模型更有吸引力。在金融领域,新鲜度甚至更为关键。利率、费用和账户条款可能每月甚至更频繁地变化,因此过时的片段会被迅速丢弃。

伤害与安全过滤器

最后,选择过程通常会应用伤害与安全过滤器。这可能意味着移除那些向初学者推荐不安全做法的片段,例如每周长跑里程增加超过 10%,或者可能被视为投机或误导的财务建议。这些过滤器可以是领域特定的,既依赖于明确的政策,也依赖于从训练数据中学习到的模式。

优质内容为何会被排除

对于内容创作者来说,一个最令人沮丧的现实是,高质量且相关的内容仍然可能被排除在合成之外。这通常是因为格式或呈现方式与可提取性需求不符。一个设计精美、包含大量信息的交互式内容,如果其数据没有以可抓取、可解析的方式暴露出来,就可能不可见。将叙述前置、把关键事实深埋在页面下部的长文内容,仅仅因为模型在其检索集中更早地找到了密度更高、更易用的材料,就面临着被跳过的风险。

GEO 启示:为选择漏斗而设计

对于 GEO 而言,选择阶段的教训是优化必须发生在片段层面,而不仅仅是页面或网站层面。每一则关键信息应当:

  • 范围清晰:预先说明条件和适用性。
  • 证据密度高:快速提供价值。
  • 格式易于提取:使用表格、列表或描述性标题下的短段落呈现。
  • 尽可能由可信专家撰写或审阅
  • 为新鲜度而标注日期和版本

在实践中,这意味着重新思考你如何结构化内容。一个单一的长页面可能需要设计成一系列清晰标记、自包含的模块,每个模块在被提取到生成式答案中时都能独立存在。这也意味着为每个片段配备相应的元数据、标记和替代格式,以便检索系统更容易识别和使用。

当你的内容通过这个阶段时,合成层就能提取它、信任它,并将其融入更大的叙述中,而无需重新加工。在生成式搜索的世界里,这种就绪状态决定了你的作品是否真正出现在用户看到的答案中。

端到端的旅程

为了看清查询扇出、子查询路由和选择是如何协同工作的,我们可以通过一个例子,从用户输入到最终生成的答案,走一遍整个流程。回到我们的锚定查询:‘最佳半程马拉松初学者训练计划’。

这个过程从用户提交查询的那一刻就开始了。在扩展阶段,系统对领域和任务类型进行分类,识别出时间框架、跑者画像等槽位,并投射出装备推荐、伤病预防、营养建议等潜在意图。它将查询重写为更具体或替代的形式,如‘针对初次跑者的16周半程马拉松训练计划’或‘半程马拉松跑走结合计划’,并生成推测性后续问题,如‘初学者每周应该跑多少英里来备战半程马拉松?’在此阶段结束时,原始查询已演变成一个由15到20个子查询构成的网络,每个子查询瞄准用户需求的特定方面。

在路由阶段,这些子查询各自被匹配到最合适的来源和模态。训练计划子查询被发送到网络索引,偏好文本和表格形式。装备清单子查询瞄准电商产品页面和体育零售商指南,理想格式是表格或列表。拉伸动作子查询指向视频库,但系统更倾向于提取字幕以便快速解析。里程递增问题则会命中填充了教练数据的结构化知识库,而营养指南则被路由到经过审核的健康和运动医学来源。所有这些构建了一个扇出地图,其中原始查询的每个分支都导向一个或多个来源,每个来源都有自己的检索策略。

在选择阶段,所有这些检索返回的结果将根据可提取性、证据密度、范围清晰度、权威性、新鲜度和佐证程度进行评分。一个以干净表格形式呈现的16周计划胜出;而深埋在长篇博客文章中的叙述性描述则被淘汰。一个在表格中注明重量、天气适用性和价格的装备清单被保留;一个没有替代文本的图片轮播则被丢弃。一条引用了运动医学权威机构的伤病预防技巧通过筛选;一条没有来源的观点则被排除。选择结束时,数百个检索到的片段被缩减为十几条高质量、可立即使用的信息单元。

随后,合成层将这些片段组装成一个连贯的答案:一段介绍性文字,说明初学者可以从半程马拉松计划中期待什么;一张每周里程递增的表格;一个必备装备的项目符号列表;一段关于伤病预防策略的简短段落;以及一两张内嵌的拉伸技巧图片。答案中的每一部分都经过了三轮筛选,每一部分都来自扇出树的不同分支。最终输出比任何单一文档所能提供的都要丰富,但同时也受到了系统在每个阶段决策的深刻影响。

这里需要认识到的是,你的内容有多少次机会被包含进来,又有多少次机会被排除出去。如果你只有训练计划,没有其他内容,那么你最终可能只在答案中出现一次。但如果你还创建了装备清单、伤病预防技巧、营养指南和拉伸动作(并且以路由系统偏好的格式),那么你可能会在同一个答案中的四五个地方被呈现。

对 GEO 的战略启示

总而言之,生成式搜索不是针对单个查询的单次排名竞赛。它是一个多阶段的筛选过程,你的内容在一个分支状、多模态的检索计划中的数十个节点上竞争。扇出意味着系统既在寻找广度也在寻找深度,而合成步骤意味着它根据可提取性和就绪状态(而不仅仅是相关性)来评判你的内容。

从 GEO 的角度来看,这从四个重要方面改变了游戏规则。

首先,意图覆盖取代关键词覆盖成为竞争的主要单位。 你再也无法将一个页面针对一个查询优化后就完事。你必须预判系统将生成的扩展内容,并且必须构建直接针对这些扩展的内容。这就是主题枢纽、槽位完整的内容以及相邻意图覆盖为何重要的原因。它们确保当模型将一个查询爆炸成多个分支时,你的网站能为每个分支提供相应的内容。

其次,多模态并行已成为入场筹码。 由于路由决策是模态感知的,以文本、表格、图像、视频、字幕和结构化数据等形式提供你的信息,会为你进入检索过程提供更多入口点。如果系统判定某个子查询应该用表格来回答,而你只有散文形式,那么你在扇出的那个分支就是不可见的。

第三,片段层面的相关性工程与页面层面的优化同等重要。 选择发生在片段层面,系统只会使用那些可提取的、证据密度高的、范围清晰的、权威且新鲜的材料。这激励我们将每个信息单元(一个步骤列表、一个定义、一个对比表格)设计成如果被脱离上下文提取出来,也能成功独立存在。这意味着对该单元进行标记、结构化和版本化,让模型确切知道它是什么以及何时适用。

最后,衡量指标需要演进。 传统的 SEO 指标如排名和点击率无法捕捉生成式环境下的表现。你需要衡量子查询召回率(你出现在扇出树的多少个分支中)、原子覆盖率(你内容中满足可提取性标准的百分比)、证据密度(你内容片段中的信噪比)以及引用稳定性(在重新生成周期中你被选中的频率)。这些是告诉你是否在 GEO 环境中真正获胜的输入指标。

向生成式搜索的转变,是从为单个关键词竞争,转变为在一个动态的、多分支的检索计划中为每一个相关时刻竞争。胜出的将是那些既像发布者又像数据提供商一样思考的网站,它们为融入答案而设计内容,而不仅仅是供独立消费。这些系统将在扩展、路由和合成方面不断进步。你的工作是确保在这个过程的每一步,都有一个你的内容片段完美地契合模型试图填充的那个槽位。

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a Reply

Your email address will not be published. Required fields are marked *