固有的SEO经验也是一种阻碍

via https://www.deepcrawl.com/blog/webinars/your-seo-experience-is-holding-you-back-seo-ab-testing/

对于我们最新的 DeepCrawl 网络研讨会,我们非常高兴地欢迎 SEO A/B 测试平台 SearchPilot 的技术 SEO 顾问 Emily Potter。 加入我们的主持人,DeepCrawl 的 CAB 主席 Jon Myers,Emily 解释了 SEO A/B 测试是如何执行的,她从运行这些测试中学到的关键见解,以及为什么盲目地遵循 SEO 最佳实践实际上可能会损害我们的网站。

我们要非常感谢 Emily 的精彩演讲,感谢您抽出宝贵时间与我们分享她的知识和经验,感谢 Jon 的主持以及所有与会人员。

如何运行 SEO A/B 测试
SearchPilot 在源服务器和 CDN 之间部署他们的 SEO 测试,以便对网站进行即时更改,这允许他们为 Google 和用户运行测试。 正在对源代码进行更改,而不是通过客户端呈现来确保更改在到达用户之前进行。 这反过来意味着所有这些变化都被谷歌索引,这使得 SEO A/B 测试得以进行。

创建受控测试环境的最佳方法是拥有大量模板页面样本。 使用机器学习算法,页面被分成两组; 控制模板和变体模板。 然后,对这些页面组的更改会在整个站点范围内推出,以衡量它们彼此之间的表现。

当变体组的SEO流量大于对照组时会出现正向测试结果,当对照组表现优于变体时会出现否定的结果。因此,当两个页面之间没有统计差异时,将发生不确定结论的测试。用于分割页面的神经网络模型也用于测量结果。

SEO 测试很复杂,需要考虑很多外部因素,例如,SearchPilot 模型考虑了以下内容;

季节性
需求意外飙升
算法更新
不相关的全站更改
竞争对手的行为
由于所有这些外部因素都在起作用,因此很难获得具有统计意义的结果。

从测试结果运行到 2019 年,SearchPilot 看到 65% 的不确定测试和只有 35% 的确定结论测试。自 Emily 于 2019 年加入团队以来,他们已经看到了 43% 的结论和 57% 的不确定性的转变。 Emily 解释说,这可能是由于她为团队带来的不同观点,因为他们看到更多证据表明老式 SEO 实践并不总是有效。此外,以前认为对 SEO 没有影响的因素实际上正在导致出现积极的测试结果。

最佳实践 SEO 真的是最好的吗?
mily 解释说,通过他们的测试,SearchPilot 团队了解到大多数“最佳实践”的 SEO 策略都失败了。它们不仅提供了不确定的结果,而且大多数还损害了自然流量。

元描述示例
Emily 分享的一个例子是优化元描述,虽然它们不再影响排名,但元描述仍然是您网站自然流量的真正重要驱动因素,您可以在 SERP 中向用户宣传您的页面。然而,Emily 解释说,重写或优化这些并不是你时间的最佳利用方式。这是因为他们运行的 91% 的元描述测试没有可检测到的影响,因为它们没有结论。这得到了我们在搜索结果中看到越来越多的证据的支持,谷歌为几个排名靠前的页面生成了片段,而不是使用元描述集。

为了真正测试元描述的影响,Emily 和她的团队决定在删除描述的情况下进行一些测试。 Emily 分享的示例是针对一家全国性的药房连锁店,其中通用副本写在许多当地药房页面上。在删除元描述并等待 Google 重新索引页面后,Google 选择显示每个本地商店的营业时间和电话号码。这通常是用户在执行本地搜索时所寻找的,但可能导致没有点击搜索,这不会提高自然流量。然而,这个测试实际上是积极的,并推动了自然流量的统计显着提升。

这是一个例子,说明 SEO 经验可能会限制您使用一些非常好的测试想法。围绕元描述的一个老派想法可能是“编写一个诱人的元描述会为您的网站带来更多点击”。但是,一种新的学校方法更倾向于满足用户意图,以便为您的网站带来更多流量。

用户至上方法的最佳实践
Emily 建议不要盲目关注最佳实践方法,而是以用户至上的方法进行领导。虽然这听起来很简单,但用户实际上很难预测,当你考虑到预测谷歌认为用户喜欢什么的需要时,情况就更加复杂了。这就是SEO测试如此重要的原因。

常见问题解答架构示例
Emily 通过演示添加常见问题解答模式的影响,分享了这一重要性的示例。向网站添加结构化标记时,您只能显示一种类型,例如,带有星级的价格或常见问题解答。虽然这可能是积极的,但由于常见问题解答在 SERP 上占用了更多的空间,SearchPilot 发现对于某些网站来说,结果是消极的。对于某些行业,常见问题解答标记被证明比评级或价格片段更有价值,但对于其他行业,它正在损害他们的自然流量。

面包屑模式示例
Emily 分享的另一个示例是面包屑模式,用于转换 URL 在搜索结果中对用户的显示方式。虽然普遍的共识是,面包屑对于推动网站的自然流量很有价值,但在测试了时尚行业大型电子商务品牌的面包屑架构实施后,发现结果是否定的。

这是真正可以看到测试的好处的地方,以确定哪种模式类型对您的站点最有价值。通过在没有先测试的情况下实施这一点,品牌可能会看到自然流量的下降,而没有意识到这是由于这个微小的变化造成的。这些结果进一步强调了大品牌通过不犯错误来取胜的事实,通过测试可以确保不会犯这些错误。

团队在审查了该测试的否定结果后确定的一个理论是,在添加面包屑模式后,原本的头部关键词 实际上已从搜索结果中删除。尽管这个词仍然出现在标题和元描述中,但重要的是,从面包屑中丢失它会损害网站的自然流量。

因此,尽管相信添加面包屑模式可以提高自然点击率,但了解用户在搜索结果中寻找和期望看到的内容以便点击进入页面仍然很重要。

这就是为什么重要的是我们不要盲目地遵循最佳实践方法,因为我们认为这是正确的做法。我们需要挑战这些想法,而是思考这对用户意味着什么。每个网站都是不同的,我们的目标受众也是如此。接受您并不总是知道结果会是什么也很重要,这就是您需要进行测试的原因,特别是如果您是一个大品牌。

排名因素未必适用
根据 Tom Capper 去年进行的一些研究,他发现“对于大量查询,传统排名因素在前 5 名结果中的影响较小”。这意味着页面排名越高,关键字的竞争力越强,反向链接和域权限等因素实际上对排名的影响就越小。相反,他发现影响这些页面的是用户数据。但是,依靠用户信号很困难,因为我们无法预测用户将如何响应。

新页面模板示例
在实施新产品页面模板时看到了一个例子,该测试证明对 CRO 是积极的,Emily 的客户希望确保它不会损害网站的自然流量。这种变化涉及使用反应来过滤不同的方面。但是,众所周知,JavaScript 会对 SEO 造成负面影响。

在将这些更改作为 SEO 测试运行后,看到的结果是积极的,并有助于提高他们的自然流量。虽然没有添加新内容,但微小的变化对自然流量产生了显着的积极影响。

关于为什么返回肯定结果有两个重要的点,首先 JavaScript 是服务器端渲染的,这意味着 Google 可以抓取页面而无需加载任何 JavaScript 本身。实施 React 还可以加快页面加载速度,进而有助于改善用户体验。

另一个例子是旅游行业的一位客户,他做了一个简单的改变,将他们的搜索小部件移动到页面顶部。虽然没有进行内容或关键字更改,但测试实际上显示了负面结果,这意味着这个小修改损害了他们的自然流量。

我们老派的最佳实践信念使我们相信移动此元素不会影响排名,因为没有对内容进行任何更改。但是,很明显,用户信号会对 SEO 产生后续影响,如果这些信号是负面的,它们可能会损害自然流量。

有些东西不会改变
当然,有一些 SEO 元素仍然同样重要,其中一个例子就是内部链接。内部链接测试是 SearchPilot 执行的最复杂的测试之一,Emily 分享了一个示例,在两个不同的站点上运行相同的测试。

该测试涉及在主要类别和子类别之间添加一些链接。在典型的 A/B 测试中,您只会更改受影响的页面,但是在测试内部链接更改时,链接的页面和链接的页面都会受到影响。

设置这些测试时,您将拥有不包含新内部链接的对照组和添加了链接的变体组。然后,测试涉及测量主要类别页面上发生的情况,以及接收链接的页面发生的情况及其综合影响。

这个测试的第一个例子是一个时尚电子商务网站,其中一个链接块被添加到主类别页面的顶部。该测试的结果表明,添加链接的主类别页面是负面的,而接收链接的子类别页面则产生了积极影响。因此,最终结果是中性的。

然而,对于一个不同的行业,一个在线杂货网站,将链接按钮添加到主类别页面的顶部显示了主类别页面和子类别页面的积极结果。因此,该测试总体上是积极的,并导致自然流量增加。

在比较这两个测试以确定为什么这些结果如此不同时,SearchPilot 研究了包括负链接资产以及可能在第一个站点上发生的潜在关键字填充等问题。相比之下,将链接添加到第二个测试示例导致网站可以排名的关键字数量增加,并提高了页面的相关性并为用户创建了新的路径。

关键要点
不要只是盲目地遵循最佳实践方法,要考虑这些变化对用户的影响,而是遵循以用户为中心的 SEO 方法
排名因素不一定适用于大品牌,用户信号现在比以往任何时候都更能影响排名
没有两个网站(或测试)是相同的,遵循最佳实践建议很容易,因为这是其他人都在做的事情,但是对您的个人网站进行测试是非常宝贵的。

Tags:

Search


Categories


Tags