破除”搜索已死”的迷思

via https://graphite.io/five-percent/debunking-the-myth-that-seo-traffic-has-dramatically-declined

当ChatGPT于2022年11月推出时,它引发了人工智能、搜索和营销领域的巨变。仅仅两个月后,ChatGPT就成为史上增长最快的消费者应用。截至2025年10月,ChatGPT每周活跃用户超过8亿,每日提示词请求量达到25亿次(数据来源),现在许多人使用ChatGPT进行搜索和发现。

这就引出了一个问题:SEO已死吗?

简短的回答是:没有。我认为,”SEO已死”的说法是基于一系列由推测、夸大、有缺陷的分析和虚假信息驱动的迷思。

迷思
在这项研究中,我旨在揭穿关于SEO流量已大幅下降(超过25%)的迷思,包括以下说法:

  1. SEO流量已经下降了25%,并且可能很快会下降50%。
  2. 大语言模型的急剧增长导致人们使用大语言模型代替搜索。现在超过60%的人使用大语言模型而不是搜索引擎,谷歌的访问量正在迅速下降。
  3. AI概览导致点击率大幅降低,从而使SEO流量急剧下降。
  4. 此外,谷歌正通过将越来越多的点击从自然结果转向广告,从而”窃取点击”。

真相
Graphite公司与Similarweb合作,分析了美国超过4万个最大的网站,以评估自然搜索流量的趋势。我们提供了大量证据,证明所谓SEO流量已急剧下降的流行说法是错误的。

  1. SEO流量仅略有下降(-2.5%),并非急剧下降。
  2. 搜索引擎的流量从2019年到2020年有所增加(+6.9%),在2022年略有下降(-1.5%),自2023年以来相对平稳(-1.0%)。事实上,2025年谷歌(+0.8%)和整个搜索引擎(+0.4%)的流量都略有增长。此外,与2024年第四季度相比,2025年第四季度谷歌的访问者数量增加了1.4%。
  3. AI概览确实会导致自然搜索结果的点击率降低(-35%)。然而,AI概览仅在大约30%的搜索中出现。在80%的情况下,在AI概览出现之前,谷歌显示精选摘要,这同样会降低点击率。
  4. 点击广告的比例略有增加,但自然点击量仍然是广告点击量的10倍。

搜索引擎流量略有下降
迷思: 从谷歌到网站的自然流量急剧下降(在-25%到-60%之间)。

真相: 从谷歌到网站的自然流量略有下降(同比下降-2.5%)。

数据: 来自所有搜索引擎的美国月度访问量。我们查看了规模最大的4万个网站,使用Similarweb的访问数据比较了2024年2月至12月与2025年1月至11月的情况。

这与谷歌在2025年8月的声明一致:”总体而言,来自谷歌搜索的网站自然点击总量逐年保持相对稳定。”(数据来源)

SEO流量略有下降(-2.5%)

数据来源

网站规模不同,SEO流量变化各异
我们比较了前4万个网站按规模划分的流量变化。前10大网站和许多较小的网站流量均有增长。流量的下降主要集中在中间层级的网站,即按规模排名的前100至前10,000名的网站。

数据来源

前10大网站流量实际上升(+1.6%)

中间层级的网站下降幅度最大

部分类别流量下降,但也有类别实现增长
新闻、健康、烹饪和娱乐类别的流量下降幅度最大,均减少了超过10%。然而,所有其他类别的下降幅度较小。服装、购物和线上市场类别均实现增长。

研究方法

如果SEO流量确实仅下降了2.5%,那为什么许多其他研究显示下降幅度要大得多,达到25%,高估了1000%?答案在于存在缺陷的研究方法,例如调查问卷以及小型、有偏见的样本(少于20个)。

调查问卷是研究流量趋势的一种有缺陷的方法
定量研究非常适合回答”是什么”和”有多少”的问题,而定性研究最适合回答”为什么”的问题。数据来源

多家知名研究公司发表了研究报告,都声称搜索量急剧下降,同时大语言模型的应用比例也相应大幅上升。

虽然我们看到流量下降了2.5%,但他们声称下降了25%,并预测未来将下降50%。

这些研究使用了有缺陷的调查问卷方法。

自我报告的调查问卷作为心理学、人机交互和市场研究领域的一种合法研究方法,已被使用了几十年。学术研究人员普遍接受调查问卷作为一种研究方法,用于帮助探索关于个人偏好和主观体验(例如,用户喜欢或不喜欢移动应用的哪些方面)以及未来行为(例如,你会投票给谁)的问题。

然而,自我报告的调查问卷并非总是合适的研究方法。特别是,当用于回答诸如过往经历、量化过往行为和客观行为等问题时,调查问卷的效果很差。这是因为人类的记忆通常不可靠。

让我们探讨一下为什么自我报告的调查问卷和人类记忆会失败,以及为什么调查问卷作为研究方法不适合评估SEO流量是否急剧下降。

  • 人类记忆通常不可靠 – 当被问及过去的量化事实,比如某人做某事的次数时,人们往往难以回忆起确切的细节,转而依靠使用记忆中的部分信息来构建一个数字答案的推断。数据来源
  • 频率错觉 – 频率错觉是一种认知偏差,指你刚刚注意到或了解到的事情突然似乎无处不在,并非因为它变得更常见,而是因为你的注意力已转向它。它源于选择性注意和确认偏误。
  • 选择性/调查偏差及无应答偏差 – 做出回应的人往往不具备代表性;即使高质量的调查,如果”缺失数据”是系统性的,也可能存在偏差(数据来源)。一项关于大语言模型应用情况的调查,可能偏向于那些比普通人更常使用大语言模型的早期采用者。
  • 问题措辞 – 措辞上的微小细节可能产生巨大且意想不到的影响。例如,比较一下这样两个问题的措辞:”你会使用ChatGPT来寻找想购买的产品吗?” vs. “回想一下你上次购买产品的情景。你是如何找到这个产品的?”前者引导参与者考虑大语言模型,并询问一个假设性问题;而后者则询问真实的过往事件和行为,不暗示答案。询问你实际做了什么,远比询问你会做什么要好得多。数据来源

我们未提及这些研究的具体名称,以避免批评特定个人或公司,而是专注于对数据和方法论的探讨。

样本量过小
一项研究观察了19个不同网站的SEO流量下降情况。其中一些网站流量下降,而另一些网站的SEO流量实际上却增长了。随后,一家主流媒体网站发表了一篇文章,标题聚焦于其中流量下降幅度最大的一个网站。

Hubspot和Monday.com的SEO流量下降的消息也成为了头条新闻。

在这些案例中,SEO流量下降是事实。然而,这些都是非常小且有偏见的样本。

轶事证据与个人经验
我多次听人说,他们听到一些轶事证据表明人们正在使用大语言模型而不是谷歌。

“我不再用谷歌搜索了,改用ChatGPT/Perplexity/Gemini。”
“我已经好几个月没用谷歌了,现在只用大语言模型。”
“我问了一教室的学生,超过一半的人说他们不再使用谷歌,转而使用大语言模型。”
轶事证据和个人经验之所以具有误导性,其原因与调查问卷的缺陷相似,只是程度更甚。

  • 可得性启发 – 人们根据例子在脑海中浮现的难易程度来估计某事物的普遍程度。
    “我看到很多人用AI而不是谷歌搜索。因此,美国民众肯定也都在转向使用AI。”
  • 虚假共识效应 – 人们系统性地高估他人与自己共享信念、行为或偏好的程度。
    “我在科技行业和风险投资领域的朋友都用AI搜索。因此,美国民众肯定也都在转向使用AI。”
  • 自我中心偏差 – 人们在推断他人想法时,会过度依赖自己的视角。
    “我自己用AI而不是搜索。因此,美国民众肯定也都在转向使用AI。”

在大多数情况下,那些声称自己不再使用搜索、完全转向AI的人,是在误导自己。

大规模面板数据是最合适的数据来源
评估市场趋势的最佳方式是使用大规模的、第一方的定量数据。

在我们的研究中,我们使用了Similarweb的数据。Similarweb通过结合来自自愿用户面板的数据、与互联网服务提供商和移动运营商的合作、公开的网络和应用信号,以及选择共享直接测量数据的网站,来估算网站和应用的流量。这些输入数据经过统计模型和机器学习技术的融合与校正,以估算访问量、流量来源和用户参与度。

Similarweb依托于商业上可获取的最大规模数字行为数据集之一,其数据来源于数亿台桌面和移动设备,覆盖全球数十亿个网站和应用。这使其具备了广泛的地理和跨平台可见性,对于比较大型网站和市场层面的趋势尤其有用。

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a Reply

Your email address will not be published. Required fields are marked *