200多项AI审计揭示：为何部分行业在AI搜索中表现不佳

原文地址：https://searchengineland.com/ai-search-audit-findings-470888

对10个行业的审计数据显示，访问失败、证据薄弱和实用性低下使得一些网站容易被AI系统绕过。

20年来，网络运行着一个简单的交易：发布满足用户需求的内容，在搜索中获得排名，赚取流量，然后通过产品、服务、联盟推荐或广告将这些流量变现。

零点击答案和AI搜索正在改写这种关系。现在的新问题是，AI是否会把你列为来源——以及这种可见度是否能转化为收入。

为了了解谁会被包含在内，谁会被绕过，我对10个行业进行了超过200次AI可见度审计。

结果模式是一致的：大多数网站易于解析，但难以证明其值得引用。而那些最依赖发现流量的行业，往往正是那些让自己最难被访问的行业。

审计是如何进行的

我使用相同的评估标准进行了201次审计，并捕获了一个整体的AI可见度得分，以及四个子得分：

新鲜度
结构
权威性与证据
可提取性

该数据集包括对以下10个行业的201次审计：

优惠券
联盟评论
旅行预订
本地目录
个人理财比较
健康信息
法律目录
在线课程
招聘网站
食谱

需要注意的是，存在页面类型偏差——样本中主页占比较大（131个主页，13篇文章，其余为混合页面）。这很重要，因为主页往往营销内容多，证据内容少。

我还跟踪了访问失败的情况，因为”错误”结果也是故事的一部分。201次审计中有38次（18.9%）返回错误，意味着AI智能体可能被阻止或无法可靠地访问内容。

另有八次审计在技术上已处理，但由于缺少子得分而得分为0，这与部分提取或应用式渲染导致可访问内容很少的情况一致。

当我总结得分分布时，我专注于成功处理的审计（163个网站），所以”无法访问”不会与”低质量”混为一谈。我按行业将错误率视为一个独立的信号，因为它表明了AI系统是否可以将某个网站可靠地用作来源。

（广告文案略）

各行业在AI可见度中的位置

下表显示了数据集中各行业在审计中的表现。

排名	行业	错误率	中位数总分	中位数权威性	中位数可提取性	风险等级
1	旅行预订和行程规划	33.3%	45.5	31.0	52.0	高
2	招聘网站和职业市场	40.0%	64.0	44.0	74.0	高
3	法律目录和潜在客户开发	35.0%	63.0	44.0	74.0	高
4	优惠券和交易	20.0%	62.0	36.0	74.0	高
5	本地目录和潜在客户开发	5.3%	64.0	38.0	74.0	中
6	在线课程和学习市场	30.0%	67.5	46.5	80.0	中
7	健康信息和症状查询	15.0%	69.0	52.0	80.0	低
8	个人理财比较	5.0%	67.0	52.0	78.0	低
9	联盟产品评论	0.0%	69.5	54.0	74.0	低
10	食谱和烹饪内容	5.0%	75.0	55.5	81.5	低

审计实际揭示了什么

调查结果显示，大多数网站并非为被持续引用而构建。以下是三个关键数据。

访问问题比大多数团队想象的要大
201个网站中有38个（18.9%）返回错误。在某些类别中，情况更糟：招聘网站（40%）、法律目录（35%）、旅行预订（33%）和课程市场（30%）。在这些领域，三分之一到近一半的市场默认情况下实际上是AI不可见的。

法律目录在所有行业中AI拦截率最高。

大多数网站陷入中间地带
在163次成功处理的审计中：

平均总分：61.6
中位数总分：66
70.6%落在”可见度不一致”区间（60至79分）
仅有4.9%达到”基础稳固”（80至94分）
0%达到”卓越”（95分及以上）

翻译过来就是：大多数品牌并未被构建成可供可靠使用和引用的状态。

差距在于证据，而非格式
成功处理审计的中位数子得分：

结构：92
可提取性：74
权威性与证据：48
新鲜度：45

大多数页面易于解析。但能轻易证明其值得引用的页面则少得多。两个反复出现的发现解释了原因：

“未检测到最后修改头”出现了114次（机器可读的新鲜度信息缺失）。
引文或出站引用仅出现13次（机器可读的证据很少见）。

这应该会改变你对风险的看法。比失去流量更大的威胁是被排除在用户的考虑集之外。

深入阅读：4项AI搜索实验揭示的归因与购买决策

（订阅新闻通讯文案略）

行业从AI搜索中消失的三种方式

行业消失的原因有三种。你可以把它们看作是三种失效模式。

1. 访问失效：AI无法可靠地访问你的内容
如果AI智能体无法持续访问你的内容，模型可用的素材就少，它会要么绕过你，要么从其他来源填补空白。

访问失效的表现形式：

机器人保护、速率限制或将智能体视为敌对的Web应用防火墙（WAF）规则。
应用式渲染，其中有意义的内容从未在初始HTML中送达。
内容被隐藏在无法顺利解析的提示、弹窗或脚本之后。

为何这会导致消失：

如果AI系统无法可靠地提取，它们就无法可靠地引用。
用户的意图仍然得到满足——只是通过其他人的可抓取内容或原生AI答案来满足。

2. 信任失效：AI可以读取你，但无法证明引用你的合理性
信任失效更为隐蔽。智能体可以访问你的页面、解析它、总结它，但页面没有提供足够的证据让模型有信心将其作为来源引用。

这是已完成审计中的主导模式。用通俗的话说：你的内容可读，但不可辩护。

比较页面类型时，这一点最清晰地显现出来：

文章页面的中位数权威性得分：76
主页的中位数权威性得分：45

一个精美的主页不是证据。如果你希望除了品牌名称之外的任何内容被引用，一个典型的主页本身是不够的。证据通常存在于文章、解释说明、数据页面、政策页面和方法论页面中。

3. 效用失效：即使你可见，点击也可能不会发生
效用失效是最痛苦的。你可能会被包含在内。你可能会被引用。但如果你的价值仅仅是信息，AI可以将其压缩成一个答案，用户就永远不需要访问你的网站。

可见度决定了你是否出现在对话中。效用决定了出现是否能转化为收入。

一个实用的思考方式：

如果你的页面回答了问题，AI可以替代该页面。
如果你的产品或服务完成了任务，AI仍然需要你。

访问失效让你被排除在外。信任失效让你被跳过。效用失效让你被总结。

为什么某些行业显得脆弱

一旦将访问、信任和效用放在一起看，脆弱的行业就不再显得随机。

在我的数据集中，反复显示出高风险类别的行业具有三个共同特征：

访问不一致（存在阻止和提取问题）。
内容易于压缩成单一答案。
一旦答案被提供，业务就没有后续步骤的价值。

这就是为什么旅行预订、招聘网站、法律目录和优惠券网站在本数据集中成为风险最高的类别。

更大的启示是什么？即使你的业务健康，你的网站构建方式也可能招致被排除在外。

200多项AI审计揭示：为何部分行业在AI搜索中表现不佳

Leave a Reply Cancel reply

Leave a Reply Cancel reply