原文地址:https://searchengineland.com/ai-search-audit-findings-470888
对10个行业的审计数据显示,访问失败、证据薄弱和实用性低下使得一些网站容易被AI系统绕过。
20年来,网络运行着一个简单的交易:发布满足用户需求的内容,在搜索中获得排名,赚取流量,然后通过产品、服务、联盟推荐或广告将这些流量变现。
零点击答案和AI搜索正在改写这种关系。现在的新问题是,AI是否会把你列为来源——以及这种可见度是否能转化为收入。
为了了解谁会被包含在内,谁会被绕过,我对10个行业进行了超过200次AI可见度审计。
结果模式是一致的:大多数网站易于解析,但难以证明其值得引用。而那些最依赖发现流量的行业,往往正是那些让自己最难被访问的行业。
审计是如何进行的
我使用相同的评估标准进行了201次审计,并捕获了一个整体的AI可见度得分,以及四个子得分:
- 新鲜度
- 结构
- 权威性与证据
- 可提取性
该数据集包括对以下10个行业的201次审计:
- 优惠券
- 联盟评论
- 旅行预订
- 本地目录
- 个人理财比较
- 健康信息
- 法律目录
- 在线课程
- 招聘网站
- 食谱
需要注意的是,存在页面类型偏差——样本中主页占比较大(131个主页,13篇文章,其余为混合页面)。这很重要,因为主页往往营销内容多,证据内容少。
我还跟踪了访问失败的情况,因为”错误”结果也是故事的一部分。201次审计中有38次(18.9%)返回错误,意味着AI智能体可能被阻止或无法可靠地访问内容。
另有八次审计在技术上已处理,但由于缺少子得分而得分为0,这与部分提取或应用式渲染导致可访问内容很少的情况一致。
当我总结得分分布时,我专注于成功处理的审计(163个网站),所以”无法访问”不会与”低质量”混为一谈。我按行业将错误率视为一个独立的信号,因为它表明了AI系统是否可以将某个网站可靠地用作来源。
(广告文案略)
各行业在AI可见度中的位置
下表显示了数据集中各行业在审计中的表现。
| 排名 | 行业 | 错误率 | 中位数总分 | 中位数权威性 | 中位数可提取性 | 风险等级 |
|---|---|---|---|---|---|---|
| 1 | 旅行预订和行程规划 | 33.3% | 45.5 | 31.0 | 52.0 | 高 |
| 2 | 招聘网站和职业市场 | 40.0% | 64.0 | 44.0 | 74.0 | 高 |
| 3 | 法律目录和潜在客户开发 | 35.0% | 63.0 | 44.0 | 74.0 | 高 |
| 4 | 优惠券和交易 | 20.0% | 62.0 | 36.0 | 74.0 | 高 |
| 5 | 本地目录和潜在客户开发 | 5.3% | 64.0 | 38.0 | 74.0 | 中 |
| 6 | 在线课程和学习市场 | 30.0% | 67.5 | 46.5 | 80.0 | 中 |
| 7 | 健康信息和症状查询 | 15.0% | 69.0 | 52.0 | 80.0 | 低 |
| 8 | 个人理财比较 | 5.0% | 67.0 | 52.0 | 78.0 | 低 |
| 9 | 联盟产品评论 | 0.0% | 69.5 | 54.0 | 74.0 | 低 |
| 10 | 食谱和烹饪内容 | 5.0% | 75.0 | 55.5 | 81.5 | 低 |
审计实际揭示了什么
调查结果显示,大多数网站并非为被持续引用而构建。以下是三个关键数据。
访问问题比大多数团队想象的要大
201个网站中有38个(18.9%)返回错误。在某些类别中,情况更糟:招聘网站(40%)、法律目录(35%)、旅行预订(33%)和课程市场(30%)。在这些领域,三分之一到近一半的市场默认情况下实际上是AI不可见的。
法律目录在所有行业中AI拦截率最高。
大多数网站陷入中间地带
在163次成功处理的审计中:
- 平均总分:61.6
- 中位数总分:66
- 70.6%落在”可见度不一致”区间(60至79分)
- 仅有4.9%达到”基础稳固”(80至94分)
- 0%达到”卓越”(95分及以上)
翻译过来就是:大多数品牌并未被构建成可供可靠使用和引用的状态。
差距在于证据,而非格式
成功处理审计的中位数子得分:
- 结构:92
- 可提取性:74
- 权威性与证据:48
- 新鲜度:45
大多数页面易于解析。但能轻易证明其值得引用的页面则少得多。两个反复出现的发现解释了原因:
- “未检测到最后修改头”出现了114次(机器可读的新鲜度信息缺失)。
- 引文或出站引用仅出现13次(机器可读的证据很少见)。
这应该会改变你对风险的看法。比失去流量更大的威胁是被排除在用户的考虑集之外。
深入阅读:4项AI搜索实验揭示的归因与购买决策
(订阅新闻通讯文案略)
行业从AI搜索中消失的三种方式
行业消失的原因有三种。你可以把它们看作是三种失效模式。
1. 访问失效:AI无法可靠地访问你的内容
如果AI智能体无法持续访问你的内容,模型可用的素材就少,它会要么绕过你,要么从其他来源填补空白。
访问失效的表现形式:
- 机器人保护、速率限制或将智能体视为敌对的Web应用防火墙(WAF)规则。
- 应用式渲染,其中有意义的内容从未在初始HTML中送达。
- 内容被隐藏在无法顺利解析的提示、弹窗或脚本之后。
为何这会导致消失:
- 如果AI系统无法可靠地提取,它们就无法可靠地引用。
- 用户的意图仍然得到满足——只是通过其他人的可抓取内容或原生AI答案来满足。
2. 信任失效:AI可以读取你,但无法证明引用你的合理性
信任失效更为隐蔽。智能体可以访问你的页面、解析它、总结它,但页面没有提供足够的证据让模型有信心将其作为来源引用。
这是已完成审计中的主导模式。用通俗的话说:你的内容可读,但不可辩护。
比较页面类型时,这一点最清晰地显现出来:
- 文章页面的中位数权威性得分:76
- 主页的中位数权威性得分:45
一个精美的主页不是证据。如果你希望除了品牌名称之外的任何内容被引用,一个典型的主页本身是不够的。证据通常存在于文章、解释说明、数据页面、政策页面和方法论页面中。
3. 效用失效:即使你可见,点击也可能不会发生
效用失效是最痛苦的。你可能会被包含在内。你可能会被引用。但如果你的价值仅仅是信息,AI可以将其压缩成一个答案,用户就永远不需要访问你的网站。
可见度决定了你是否出现在对话中。效用决定了出现是否能转化为收入。
一个实用的思考方式:
- 如果你的页面回答了问题,AI可以替代该页面。
- 如果你的产品或服务完成了任务,AI仍然需要你。
访问失效让你被排除在外。信任失效让你被跳过。效用失效让你被总结。
为什么某些行业显得脆弱
一旦将访问、信任和效用放在一起看,脆弱的行业就不再显得随机。
在我的数据集中,反复显示出高风险类别的行业具有三个共同特征:
- 访问不一致(存在阻止和提取问题)。
- 内容易于压缩成单一答案。
- 一旦答案被提供,业务就没有后续步骤的价值。
这就是为什么旅行预订、招聘网站、法律目录和优惠券网站在本数据集中成为风险最高的类别。
更大的启示是什么?即使你的业务健康,你的网站构建方式也可能招致被排除在外。
