从关键词到问题，从问题到对话——再超越到意图编排

via https://ipullrank.com/ai-search-manual/search-intent

搜索从未停滞不前。其演进的每个阶段，都取决于系统能否准确理解人们意图——而不仅仅是他们输入了什么字词。我们已从“统计词语序列”发展到了“预判用户甚至没有说出来的行为”。

查询的演进：从 N-Gram 到意图编排的动作

搜索进程快照：

N-Gram 匹配 → 基础词法搜索
意图识别 → 面向目标的信息获取
自然语言查询 → 完整句子、富有上下文信息的输入
对话式查询 → 多轮对话的上下文记忆
编排动作 → AI 推断并执行下一步操作，或提示用户提供更多上下文信息

早期搜索：字面匹配

搜索最初就是模式匹配。

早期搜索引擎在文档中寻找精确的关键词字符串。如果你搜索“best pizza NYC”，系统会把它拆分成独立的词项（一个 N-Gram 模型），然后在已索引的页面中进行匹配。没有上下文、没有语义，纯粹的字面匹配。

随着互联网的爆发，这种粗放的方法在“歧义”的重压下崩溃了。因为同一个词可能有多种含义，没有上下文，相关性就像猜谜游戏：“Apple”可以指水果、科技公司或唱片公司，而系统无法区分。这时，意图分类就登场了——不再只是匹配词语，而是将词语映射到用户想要实现的目标上。

Andrei Broder 在 2000 年代初提出的分类框架，成了 SEO 从业者默认的心智模型：

信息型（Informational）：用户想了解某些信息。（例如：“什么是 Schema 标记？”）
导航型（Navigational）：用户想到达某个特定网站或页面。（例如：“iPullRank 博客”）
交易型（Transactional）：用户想执行某个操作。（例如：“在线购买跑鞋”）

Broder 的分类并非完美，但它为搜索团队提供了一种超越搜索框中“字符串”本身的思考方式。尽管 Google 的工程师们在此后多年中不断扩展这一模型，引入了商业调研（commercial investigation）等更细粒度的子意图，但这三种基本类型至今仍影响着许多营销人员进行关键词研究的方式。

对于 SEO 而言，这意味着一个明确的转变：

停止盲目追逐原始的关键词数量。
开始让内容与搜索的目的对齐。
构建能满足完整意图的页面，而不仅仅是匹配查询词。

例如，在 2000 年代初期，搜索“cheap flights to Chicago”可能会返回一篇老博客文章，里面恰好出现了那个短语。而一旦意图分类成熟，搭载实时票价数据的订票引擎就会把那种博客文章挤到第一页之后。

自然语言处理（NLP）进一步扩展了这一范畴：

更长、更具描述性的查询
对同义词和相关概念进行建模的语义模型
早期的问答系统（例如：“谷歌的 CEO 是谁？”）

问题的兴起

当搜索引擎更擅长解析语义之后，用户也开始改变他们提问的方式。“头词（head terms）时代”——那种短小的两三个词短语——逐渐让位于完整句子的查询。你不会再搜“SUV safety ratings”，而是会搜“What’s the safest SUV for families in 2024?”

两大转变推动了这一趋势：

NLP 的突破：Google 在 2013 年的 Hummingbird（蜂鸟）更新，以及后续的机器学习模型（如 RankBrain 和 BERT），提升了系统将长尾自然语言查询映射到相关结果的能力。
对系统的信任：用户意识到，他们不再需要“像搜索引擎一样说话”了。系统能够解析语义差别和用户意图。

从 SEO 的角度看，这意味着从“针对关键词优化”转向“针对答案优化”。

每个查询带来更丰富的上下文：问题往往能揭示用户的意图阶段和约束条件。
以答案为中心的优化：结构化数据、常见问题解答（FAQ）以及简洁的专家摘要变得至关重要。
零点击曝光：知识图谱（Knowledge Graph）和精选摘要（Featured Snippets）将答案直接呈现在搜索结果页（SERP）上。

因此，在 Hummingbird 之前，搜索“Who is the president of France?”会返回一系列网页，你需要点进去才能找到答案。而在 Hummingbird 之后，答案“Emmanuel Macron”会立刻出现在知识面板中，这些信息来源于维基百科等结构化数据源。

对话接管

真正与传统搜索决裂的是多轮交互。AI 驱动的界面能够记住你刚刚问过什么，并将这一上下文延续下去，无需你重复说明各项参数。

一个典型的对话流程：

“哪款 CRM 最适合中型 B2B 公司？”
“这些里面哪个能与 HubSpot 集成？”
“能帮我对比一下价格吗？”

传统搜索会将以上每个查询都视为独立的。而 AI Mode 和 ChatGPT 则会记住整个对话线索，自动沿用你之前给出的约束条件。这就是上下文保留——多轮交互中的一项核心能力。

对于 SEO 和 GEO（生成式引擎优化）来说，这意味着：

后续问题驱动更深入的发现：后面的问题可能会从你网站的不同部分抓取信息，而不是像第一个查询那样只从一个地方获取。
内容必须相互关联：单个落地页是不够的。AI 可能会从多个内容资产中抽取片段来综合出一个答案。
分支话题也需要覆盖：AI 可能会探索你没有预料到、但仍与原始查询相关的旁支话题。

在 Google AI Mode 中，以“最适合企业的 SEO 工具”开始，接着问“哪些有人工智能功能？”——搜索不会从头开始。系统会对之前的综合结果进行筛选，并返回一组更新后的推荐，通常会融合多个来源。

在实践中，这意味着你需要设计一个能够覆盖整个主题或一组相关主题的内容生态系统。你要让 AI 将你视为一个持续相关、能处理多轮交互、具有权威性的信息贡献者。这也正是 Google 正在加大对试图涉足自身核心能力之外主题的网站进行惩罚的原因。

意图编排

我们现在已经进入了一个新的阶段：AI 能够同时编排多个意图。因为意图不是静态的，AI 会利用用户输入的字面查询、过往交互记录、用户画像以及实时数据，来预测用户的下一步行动。

正如我们在前一章中所探讨的，Google AI Mode 在回应像“计划一次十月份去里斯本的旅行”这样的查询时，可能会：

提取航班和酒店数据
根据你过去的预订行为进行筛选
推荐符合你兴趣的当地活动

而集成了各种工具的 ChatGPT-5 则可以更进一步：

起草一份定制化的行程单
完成预订
将提醒事项添加到你的日历中

对于 GEO 而言，挑战在于：当 AI 编排这些不同环节之间的转换时，如何确保你的品牌始终在 AI 的考虑范围之内。这意味着需要：

将内容映射到多种意图状态
使用结构化数据，让 AI 更容易在你的不同内容资产之间“跳转”
预判 AI 可能会转向的相邻话题
为产品和服务提供清晰的参数和结构化数据
将操作指南模块化，方便 AI 将其重新格式化为清单
保持本地或利基数据的实时性和准确性，以便能够获得实时推荐

超越：主动型智能体与提示词反演

下一波搜索与 AI 交互将同时朝着两个方向发展——一边是无需等待提示就能代表你行动的智能体，另一边是在给出结果之前暂停下来、向你提出更优问题的系统。

主动型智能体

主动型智能体能够根据你的行为模式、所处环境以及外部数据流，检测出潜在的需求。它们不只是响应，而是会主动发起行动。

示例：

一个企业级 AI 发现，你的品牌在 AI Mode 中针对某个高价值产品查询的前三名结果里缺失了，于是它向你的营销团队发出提醒，并附上优化建议。
一个旅行助手看到你预订了一张去参加会议的机票，便自动查找会场附近的酒店选项，并根据你的会员计划进行筛选。

对于 GEO 和相关性工程（Relevance Engineering）而言，这要求：

提供结构化、可访问的数据，随时准备集成到自动化工作流中
及时更新，确保推荐结果值得信赖
明确的操作端点（预订、购买、注册），让智能体能够执行，而不仅仅是建议

提示词反演

提示词反演，是指 AI 主动向你询问它知道自己所需的上下文信息，以便提供更好的结果。系统不再强迫用户去预判正确的措辞，而是自己引导信息完善的流程。

示例：

Google AI Mode 在回复“计划一次十月份去里斯本的旅行”时，会先问“你是独自旅行还是跟团？”，然后再展示结果。
ChatGPT-5 在回应“帮我选一款 CRM”时，会先问“你更看重集成能力、成本，还是可扩展性？”，从而缩小输出范围。

这对 SEO 和 GEO 同样具有影响：

内容必须能够适应不同的后续追问场景，无论 AI 如何引导对话流程，你的内容都始终有资格被选用。
覆盖深度至关重要——AI 可能在你内容的第二或第三轮交互中才将其呈现，而非第一轮。
话题应该足够细粒度，将概念拆解成原子化、可链接的想法，使其能够作为特定后续问题的直接答案。

总而言之，主动型智能体与提示词反演共同标志着一种转变：从“拉取式”的搜索模型，走向持续、自适应的辅助模式——在这种模式下，相关性不仅关乎匹配一个查询，更在于当 AI 引导交互时，你能否始终保持有用。

为 AI 搜索扩展意图分类体系

信息型/导航型/交易型这一模型曾经发挥了它的作用，但对话式搜索需要更广阔的视角。令人高兴的是，甚至在 AI 搜索发展之前，SEO 从业者就已经在探索人们在搜索中使用的各种细粒度子意图了。

在 AI 平台中，许多交互都是探索性的、迭代式的，甚至是“环境式”的——根本没有明确的“搜索”时刻。

在 AI 语境下，意图可以包括：

信息型：寻求知识或澄清
导航型：定位特定网站、应用或个人资料
交易型：完成购买或预订
比较型：并排评估多个选项
探索型：开放式的发现
澄清型：根据反馈收窄或重新定义
编排型：启动一系列相关动作
环境型：接收主动的、由上下文触发的更新

最后三种与 GEO 尤其相关。在编排型和环境型模式下，从用户的角度看，“搜索”这一步可能会完全消失——AI 在后台无形地完成检索、评估和执行。

Profound 平台针对特定查询整理了各类搜索意图的数据：

（此处应有图表，描述各类 AI 搜索意图）

为什么这对 SEO/GEO 很重要？

只为可见的搜索查询进行优化的品牌，将会在这些“隐形”交互中失去可见性。内容需要能够在动作编排层面被发现、被使用。

类别	意图类型	描述	示例
面向搜索	信息型	寻求知识或澄清	什么是生成式引擎优化？
	定义型	询问某个术语或概念的含义	定义“潜在语义索引”。
	操作指南型	请求逐步的操作说明或流程	如何在 Google 搜索中设置 AI Mode？
	原因型	询问理由、原因或解释	为什么我的网站在品牌关键词上没有排名？
	事实核查型	验证某个具体说法或数据点	Google 是否从搜索结果中移除了缓存链接？
	比较型	直接对比两个或多个选项	面向企业研究的 Gemini 对比 ChatGPT。
	评价型	请求意见或定性评估	Perplexity 比 AI Mode 更好吗？
	购买推荐型	询问应该买什么产品或服务	适合 500 人 SaaS 公司的最佳 CRM 是什么？
	使用推荐型	寻求关于如何使用已有物品的建议	如何优化 HubSpot 以进行 SEO 跟踪？
	位置型	询问某物（物理或数字）在哪里	AI Mode 的设置菜单在哪里？
	品牌导航型	请求打开或到达特定网站、应用或工具	打开 iPullRank 的 AI 搜索手册。
交易型	预订型	请求预约或安排日程	预约下周与 iPullRank 的会议。
	注册型	请求注册、订阅或创建账户	帮我报名参加 AI Mode 网络研讨会。
	下载型	请求文件、资料或应用程序	下载《AI 搜索手册》PDF。
	购买型	直接请求购买	购买 SEO Week 门票。
探索与上下文构建	探索型	没有固定目标的开放式发现	向我展示 2025 年有趣的 AI 专利。
	澄清型	根据反馈收窄或重新定义	我指的是自然排名，不是付费排名。
	编排型	启动一系列相关动作	创建一个内容计划并把草稿发给我。
	环境型	接收主动的、由上下文触发的更新	当 Google 更新 AI Mode 时通知我。
	主动型智能体	AI 无需查询即主动提供帮助	“我注意到你昨天搜索了‘AI Mode’——想了解一下更新吗？”
	提示词反演	AI 提出澄清性问题以优化结果	“你想要企业级还是中小型企业解决方案？”
生成与创意	创意生成型	请求生成原创创意内容	写一篇关于 GEO 的领英帖子。
	文档起草型	请求正式或有结构的写作	起草一份关于 AI 驱动 SEO 策略的提案。
	可视化型	请求图表、示意图或其他可视化内容	制作一张 AI Mode 采用趋势图。
	改写型	要求在不改变原意的前提下重新表述	把这篇博客文章改写成更口语化的风格。
实用与故障排除	故障排除型	报告问题并寻求解决方案	我的 AI Mode 无法加载——出了什么问题？
	操作请求型	要求执行某个实用任务	统计一下本文档中“AI Mode”出现了多少次。
	空意图	含义不清、乱码或混杂到无法修复	asdfg1234？求助？？
混合与多意图	多轮探索	在多轮对话中从一个意图演变到另一个意图	什么是 GEO？→ 如何将其应用于电商？

从 Broder 早期的三部分模型到今天这个扩展后的分类体系，这一演进过程反映了人们与搜索引擎和对话平台的交互日益复杂。一次交流现在可以混合多个目标，毫无预兆地转变方向，或者激发全新的探索线索。

由此得出几个重要的结论：

意图很少是固定不变的；它们可能在对话中途随着用户关注点的变化而发生转变。
多个意图可以在同一交流中并存，从而影响系统对请求的解读方式。
非搜索意图同样会产生有意义的对话数据和回复，进而塑造整个交互过程。
来自前几轮对话的上下文可以延续下去，影响后续结果，而用户无需重复自己的话。
现代对话系统通过在处理检索之前重写用户输入来适应这些模式。它们不再处理单一的原始查询，而是：
- 将其拆解为针对请求特定方面的子查询
- 使用段落检索从源材料中提取聚焦、相关的片段
- 运用查询重写来澄清歧义语言、扩展隐含意义，或与系统的知识结构对齐

这些步骤在后台无形地发生，但它们决定了最终答案的质量和准确性。下一节将详细解读这些过程。在本书的后面部分，我们将探讨一个查询如何通过查询扇出（query fan-out）分支为多个检索路径，从而从一个起点生成一个由相关结果构成的网络。

AI 如何分解复杂查询

当人与人交谈时，我们会省略步骤：遗漏细节、在句子中间改变方向、使用代词而不是重复说过的话。大语言模型和对话式搜索平台必须实时填补这些空白——而这正是子查询、段落检索和查询重写发挥作用的地方。

这些过程隐藏在 AI Mode、ChatGPT、Claude 以及类似系统的引擎盖之下。你输入的可能只是一个句子，但机器会将其拆解成多个结构化的请求，找到相关的片段，再将它们重新组合成一个答案。

子查询

一个复杂的查询往往会被拆分成多个离散的搜索请求，每个请求针对你输入内容的某个特定方面，这些请求被称为“子查询”。

以这个查询为例：

“比较 Trek FX 3 和 Specialized Sirrus 用于通勤的优劣，并告诉我哪一款更适合多雨气候。”

AI 系统可能会在内部运行如下子查询：

“Trek FX 3 规格”
“Specialized Sirrus 规格”
“最适合多雨气候的通勤自行车”
“Trek FX 3 在雨中的表现”
“Specialized Sirrus 在雨中的表现”

对于 SEO 和 GEO 而言，这意味着：即使你的内容从未针对完整的原始查询排名，它仍然可以为最终答案做出贡献。它只需要满足其中某一个子查询即可。

子查询针对问题的特定方面（“最佳跑鞋” → “最适合扁平足的跑鞋”、“顶级品牌”、“2025 年最新款”）。
它们允许从多个知识源并行检索。
它们能够捕捉用户可能没有明确说出的次级意图。

优先事项：

主题深度：覆盖那些可能被拆解成子查询的相关角度。
内容粒度：使用清晰的标题和段落，便于进行段落级别的提取。

段落检索

现代搜索代理不再评估整个页面，而是寻找最相关的段落——那些紧凑、自包含、能够直接满足某个需求的部分。

关于段落排序的研究论文（例如 Rodrigo Nogueira 和 Kyunghyun Cho 撰写的《用 BERT 进行段落重排序》）描述了如何使用上下文窗口来对片段进行评分。在 AI Mode 中，这些段落可以从多个网站拼接在一起，形成综合后的回答：

你那篇关于混合动力自行车的 3000 字博客文章，可能只有两段文字是关于“耐雨性”的。
如果那一部分写得清晰且结构良好，AI 可以直接将其提取到答案中，而无需阅读文章其余部分。

Dan Petrovic 关于网页长度的研究分析了 44,684 个网页，并使用 Gemini 的 token 计数器测量了它们的 content 长度。研究发现，网页内容长度的中位数约为 2400 个单词，即大约五页文本，相当于约 3200 个 token。然而，一次检索十个文档可能超过 350,000 个 token，因此在预算规划时需要牢记这一点。

他的建议如下：

按中位数（3K token）进行设计，但要确保能够处理 99% 分位数（140K token）的情况。
预料到不同来源之间会有很大差异。
预算要保守，因为由于离群值的存在，平均成本可能是中位数成本的三倍。

查询重写

AI 平台并不总是按字面意思理解你的输入。它们会重新组织你的问题，以提高清晰度和检索质量。这就是查询重写——连接面向人类的用户体验（UX）与面向 AI 系统的智能体体验（AX）的关键桥梁。

在 Google AI Mode 中，这通常是在后台无声进行的。例如下面这个请求：

“十月份去里斯本开会，我应该住在哪里？”

可能在内部被重写为：

“里斯本会议中心附近酒店”
“里斯本十月有房酒店”
“里斯本商务旅客好评酒店”

关于“查询分解”的研究论文也展示了类似的行为——优化查询以更好地匹配检索索引，有时还会通过加入同义词或相关术语来扩展查询。

对 AI 搜索策略的影响

理解这些机制，可以帮助你设计出对 AI 友好（而不是刻意迎合）的内容。我们将在第 9 章深入探讨这一点。简而言之，这意味着：

构建富含实体的内容，这样即使经过查询重写，AI 仍然能够找到你。
将文章组织成清晰的章节，使其能够作为独立的段落发挥作用。
覆盖那些可能衍生为子查询的相邻子话题。

面向人类的用户体验（UX）→ 面向智能体的智能体体验（AX）

过去，搜索的设计是为了供人类消费：清晰的页面标题、直观的布局、符合人们扫读习惯的内容层级。但正如我们所见，对话式 AI 平台完全不像人类那样“阅读”你的内容。它们会解析、切分，并将其塞入一个支持综合与行动的框架中。这种转变改变了你工作的受众——现在你是在为两个截然不同的“解读器”而构建：人类和智能体。

面向人类的 UX 侧重于：

视觉层级：标题、子标题和易于扫读的区块
情感线索：文案语调、图像和讲故事，以吸引用户
交互设计：按钮、菜单和引导手动导航的流程

面向智能体的 AX 则需要：

显式的实体定义：命名实体、清晰的关系和一致的术语，以便智能体解析含义
结构清晰：内容被分解为标记清晰、语义一致的段落，便于解析
可执行格式：明确陈述的指令、参数和条件
消除歧义：直接将上下文嵌入文本，避免多重解读

在实践中，AI Mode 返回的结果可能永远不会暴露你原本的视觉设计。它可能只提取一个段落，与其他来源融合，并以适合答案综合的方式重新表述。而 ChatGPT 甚至可能更进一步——获取你的结构化内容，并在此基础上执行任务，例如总结、比较或生成下一步行动。

这就引出了核心问题：内容应该创建两个版本（一个针对人类体验优化，一个针对智能体解析优化），还是一个单一内容就能同时很好地服务于两者？

独立版本可能提供最大程度的控制，但会使制作工作量翻倍。
混合方法侧重于结构上的双重性：为人类提供展示性线索，为智能体叠加机器可读的框架。

因此，一个产品对比页面可以这样处理：

面向人类：页面包含照片、优缺点列表和行动号召按钮
面向智能体：页面还包含结构化产品数据、显式的品牌提及、统一的单位以及无需视觉上下文即可解析的明确比较因素。

随着智能体承担更多主动行为（在用户提问之前主动提供信息、执行一系列动作），这种双重优化变得愈发关键。同样的内容可能既需要驱动引人入胜的人类体验，又需要为 AI 驱动平台后台中不可见的 API 调用提供燃料。

人类 UX 与面向智能体的 AX：设计元素映射

人类 UX 元素	对人的作用	AX 对应项	对智能体的作用	实践示例
标题与子标题	将内容分解为可读的区块；标示主题层级	语义化的章节标签（H 标签、Schema 标题）	帮助智能体将内容分割并分类为逻辑部分	H2：“最适合扁平足的跑鞋”，并关联产品类别的 schema 标记
引言段落	设定背景，激发好奇心	富含上下文的实体定义	尽早确立主题范围和关系，以便准确检索	前两句话定义“扁平足”及其对跑步生物力学的影响
视觉层级	引导用户的视线流向和优先级	元数据层级	指导智能体的解析顺序和重要性权重	使用 Aria-label 和分节标签来指示层级
图片与说明文字	增加视觉语境和情感吸引力	包含描述性实体的 Alt 文本	为智能体提供图像含义的非视觉解读	图片：“蓝色 Nike Pegasus 41” → Alt 文本：“Nike Pegasus 41 男款跑鞋，蓝色，10 码”
列表与项目符号	提高可扫读性	带分隔符的结构化列表	使智能体能够提取离散的、原子化的事实	优缺点列表，每个条目放在 `<li>` 中并带有清晰的描述符
导航菜单	帮助用户在章节间移动	带有锚点上下文的内部链接图	帮助智能体理解网站结构和主题关系	内部链接：“/running-shoes/flat-feet”，锚文本：“扁平足跑鞋”
行动号召按钮	引导人类决策	显式的操作参数	让智能体将其转化为可执行的命令	行动号召“立即预订”，配合结构化数据向预订 API 提供对象
微文案与提示框	澄清特定的交互	内联定义或元数据注释	为智能体提供解决歧义术语所需的细微差别	提示框“PR”明确为“Public Relations（公共关系）”，而非“PageRank”
对比表格	便于并排评估	结构化的对比数据集	允许智能体直接比较属性	使用产品属性和一致单位标记的 HTML 表格
故事/案例研究	建立信任和情感连接	带时间戳、实体标记的叙事区块	让智能体在上下文相关时提取示例	案例研究文本，包含公司、结果、日期的结构化提及

从为人类 UX 设计转向同时为智能体 AX 设计，这为我们理解“在新搜索环境中，谁真正控制着发现”奠定了基础。这些智能体不仅仅是抽象的软件——它们在由守门人拥有和维护的生态系统中运行，每个守门人都有自己的规则，决定什么内容被呈现、被总结，或被隐藏。

Google 仍然是主导的守门人，但其角色已经转变。AI Mode、AI Overviews 和对话式界面意味着 Google 不仅仅是对页面进行排名——它现在从检索到综合，全程编排着整个信息流。因此，你为智能体进行设计的方式，直接受到 Google 系统如何分解你的内容、解读其相关性以及判断它是否适合答案空间的直接影响。

因此，下一章将首先直接聚焦于 Google，将其作为你工作成果与用户之间的核心过滤器。在讨论诸如查询扇出（query fan-out）和多源扩展等概念之前，我们将先梳理 Google 作为主要守门人的地位如何演变，其 AI 驱动的决策如何做出——以及这对任何在其体系内争夺可见性的人意味着什么。

从关键词到问题，从问题到对话——再超越到意图编排

Leave a Reply Cancel reply

Leave a Reply Cancel reply