200多项AI审计揭示:为何部分行业在AI搜索中表现不佳

原文地址:https://searchengineland.com/ai-search-audit-findings-470888

对10个行业的审计数据显示,访问失败、证据薄弱和实用性低下使得一些网站容易被AI系统绕过。

20年来,网络运行着一个简单的交易:发布满足用户需求的内容,在搜索中获得排名,赚取流量,然后通过产品、服务、联盟推荐或广告将这些流量变现。

零点击答案和AI搜索正在改写这种关系。现在的新问题是,AI是否会把你列为来源——以及这种可见度是否能转化为收入。

为了了解谁会被包含在内,谁会被绕过,我对10个行业进行了超过200次AI可见度审计。

结果模式是一致的:大多数网站易于解析,但难以证明其值得引用。而那些最依赖发现流量的行业,往往正是那些让自己最难被访问的行业。

审计是如何进行的

我使用相同的评估标准进行了201次审计,并捕获了一个整体的AI可见度得分,以及四个子得分:

  • 新鲜度
  • 结构
  • 权威性与证据
  • 可提取性

该数据集包括对以下10个行业的201次审计:

  • 优惠券
  • 联盟评论
  • 旅行预订
  • 本地目录
  • 个人理财比较
  • 健康信息
  • 法律目录
  • 在线课程
  • 招聘网站
  • 食谱

需要注意的是,存在页面类型偏差——样本中主页占比较大(131个主页,13篇文章,其余为混合页面)。这很重要,因为主页往往营销内容多,证据内容少。

我还跟踪了访问失败的情况,因为”错误”结果也是故事的一部分。201次审计中有38次(18.9%)返回错误,意味着AI智能体可能被阻止或无法可靠地访问内容。

另有八次审计在技术上已处理,但由于缺少子得分而得分为0,这与部分提取或应用式渲染导致可访问内容很少的情况一致。

当我总结得分分布时,我专注于成功处理的审计(163个网站),所以”无法访问”不会与”低质量”混为一谈。我按行业将错误率视为一个独立的信号,因为它表明了AI系统是否可以将某个网站可靠地用作来源。

(广告文案略)

各行业在AI可见度中的位置

下表显示了数据集中各行业在审计中的表现。

排名行业错误率中位数总分中位数权威性中位数可提取性风险等级
1旅行预订和行程规划33.3%45.531.052.0
2招聘网站和职业市场40.0%64.044.074.0
3法律目录和潜在客户开发35.0%63.044.074.0
4优惠券和交易20.0%62.036.074.0
5本地目录和潜在客户开发5.3%64.038.074.0
6在线课程和学习市场30.0%67.546.580.0
7健康信息和症状查询15.0%69.052.080.0
8个人理财比较5.0%67.052.078.0
9联盟产品评论0.0%69.554.074.0
10食谱和烹饪内容5.0%75.055.581.5

审计实际揭示了什么

调查结果显示,大多数网站并非为被持续引用而构建。以下是三个关键数据。

访问问题比大多数团队想象的要大
201个网站中有38个(18.9%)返回错误。在某些类别中,情况更糟:招聘网站(40%)、法律目录(35%)、旅行预订(33%)和课程市场(30%)。在这些领域,三分之一到近一半的市场默认情况下实际上是AI不可见的。

法律目录在所有行业中AI拦截率最高。

大多数网站陷入中间地带
在163次成功处理的审计中:

  • 平均总分:61.6
  • 中位数总分:66
  • 70.6%落在”可见度不一致”区间(60至79分)
  • 仅有4.9%达到”基础稳固”(80至94分)
  • 0%达到”卓越”(95分及以上)

翻译过来就是:大多数品牌并未被构建成可供可靠使用和引用的状态。

差距在于证据,而非格式
成功处理审计的中位数子得分:

  • 结构:92
  • 可提取性:74
  • 权威性与证据:48
  • 新鲜度:45

大多数页面易于解析。但能轻易证明其值得引用的页面则少得多。两个反复出现的发现解释了原因:

  • “未检测到最后修改头”出现了114次(机器可读的新鲜度信息缺失)。
  • 引文或出站引用仅出现13次(机器可读的证据很少见)。

这应该会改变你对风险的看法。比失去流量更大的威胁是被排除在用户的考虑集之外。

深入阅读:4项AI搜索实验揭示的归因与购买决策

(订阅新闻通讯文案略)

行业从AI搜索中消失的三种方式

行业消失的原因有三种。你可以把它们看作是三种失效模式。

1. 访问失效:AI无法可靠地访问你的内容
如果AI智能体无法持续访问你的内容,模型可用的素材就少,它会要么绕过你,要么从其他来源填补空白。

访问失效的表现形式:

  • 机器人保护、速率限制或将智能体视为敌对的Web应用防火墙(WAF)规则。
  • 应用式渲染,其中有意义的内容从未在初始HTML中送达。
  • 内容被隐藏在无法顺利解析的提示、弹窗或脚本之后。

为何这会导致消失:

  • 如果AI系统无法可靠地提取,它们就无法可靠地引用。
  • 用户的意图仍然得到满足——只是通过其他人的可抓取内容或原生AI答案来满足。

2. 信任失效:AI可以读取你,但无法证明引用你的合理性
信任失效更为隐蔽。智能体可以访问你的页面、解析它、总结它,但页面没有提供足够的证据让模型有信心将其作为来源引用。

这是已完成审计中的主导模式。用通俗的话说:你的内容可读,但不可辩护。

比较页面类型时,这一点最清晰地显现出来:

  • 文章页面的中位数权威性得分:76
  • 主页的中位数权威性得分:45

一个精美的主页不是证据。如果你希望除了品牌名称之外的任何内容被引用,一个典型的主页本身是不够的。证据通常存在于文章、解释说明、数据页面、政策页面和方法论页面中。

3. 效用失效:即使你可见,点击也可能不会发生
效用失效是最痛苦的。你可能会被包含在内。你可能会被引用。但如果你的价值仅仅是信息,AI可以将其压缩成一个答案,用户就永远不需要访问你的网站。

可见度决定了你是否出现在对话中。效用决定了出现是否能转化为收入。

一个实用的思考方式:

  • 如果你的页面回答了问题,AI可以替代该页面。
  • 如果你的产品或服务完成了任务,AI仍然需要你。

访问失效让你被排除在外。信任失效让你被跳过。效用失效让你被总结。

为什么某些行业显得脆弱

一旦将访问、信任和效用放在一起看,脆弱的行业就不再显得随机。

在我的数据集中,反复显示出高风险类别的行业具有三个共同特征:

  • 访问不一致(存在阻止和提取问题)。
  • 内容易于压缩成单一答案。
  • 一旦答案被提供,业务就没有后续步骤的价值。

这就是为什么旅行预订、招聘网站、法律目录和优惠券网站在本数据集中成为风险最高的类别。

更大的启示是什么?即使你的业务健康,你的网站构建方式也可能招致被排除在外。

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a Reply

Your email address will not be published. Required fields are marked *