via https://developers.google.com/search/docs/beginner/how-search-works
Google 会从很多不同的来源获取信息,包括:
- 网页
- 用户提交的内容,例如您的商家资料和 Google 地图用户提交的内容
- 图书扫描
- 互联网上的公共数据库
- 许多其他来源
但是,此页面将重点介绍 Google 如何通过网页获取信息。Google 按照以下三个基本步骤生成基于网页的结果:
抓取
第一步是找出网络上存在哪些网页。不存在包含所有网页的中央注册表,因此 Google 必须不断搜索新网页并将其添加到已知网页列表中。由于 Google 之前已经访问过某些网页,因此这些网页是 Google 已知的网页。当跟踪已知网页上指向新网页的链接时,Google 会发现其他网页。当网站所有者以列表形式(站点地图)提交一系列网页供 Google 抓取时,Google 也会发现其他网页。如果您使用受管的网站托管服务,如 Wix 或 Blogger,这些服务可能会通知 Google 抓取您更新后的网页或添加的新网页。
Google 发现网页网址后,会访问或抓取该网页以了解其中的内容。Google 会呈现该网页,并分析文字和非文字内容以及整体视觉布局,确定该网页会显示在搜索结果中的什么位置。Google 越了解您的网站,就越能准确地将您的网站与正在查找您内容的用户相匹配。
如何改善网站抓取效果:
- 验证 Google 能否访问您网站上的网页,以及这些网页看起来是否正确。确保 Google 能以匿名用户(没有密码和信息的用户)的身份访问网页。Google 必须能够查看该网页的所有图片和其他元素,以便能够正确了解该网页。您可以在移动设备适合性测试中输入网页网址来快速检查网页。
- 如果您创建或更新了单个网页,您可以向 Google 提交具体网址。如需让 Google 同时了解多个新网页或更新后的网页,您可以使用站点地图。
- 如果您想让 Google 只抓取 1 个网页,请将该网页设为首页。在 Google 看来,您的首页就是您网站上最重要的网页。为促成完整网站抓取,请确保您的首页(以及所有网页)包含一个良好的网站导航系统,能链接到您网站上的所有重要版块和网页。这有助于用户(和 Google)在您的网站上找到所需内容。对于小型网站(少于 1000 个网页),只需让 Google 知道您的首页即可,前提是 Google 可以通过从首页开始的链接路径访问所有其他网页。
- 将您的网页链接到 Google 已知的其他网页。但是,请务必注意,Google 不会跟踪广告中的链接、其他网站中由您付费的链接、评论中的链接或其他未遵循 Google 网站站长指南的链接。
Google 不会通过收取费用来提高网站抓取频率或网站排名。任何与此不符的消息均是子虚乌有。
编入索引
发现网页后,Google 会尝试了解该网页的内容。此过程称为“编入索引”。Google 会分析该网页的内容、为网页上嵌入的图片和视频文件编制目录,并通过其他方式尝试了解网页。这些信息存储在 Google 索引中,而 Google 索引是一个存储在很多计算机中的巨大数据库。
如何改善网页索引编制效果:
- 创建简短且有意义的网页标题。
- 使用传达网页主题的网页标题。
- 使用文字(而非图片)传达内容。尽管 Google 能够理解一些图片和视频,但相比图片和视频,文字更易于理解。请至少使用替代文本和其他属性为视频和图片添加适当的注解。
呈现(和排名)
当用户输入查询时,Google 会根据许多因素尝试从其索引中找到最相关的答案。Google 会考虑用户的所在位置、语言及设备(桌面设备或手机)等因素来努力确定最优质的答案,并会考虑其他因素,尽可能提供最佳用户体验和最恰当的答案。例如,在用户搜索“自行车维修店”后,Google 向巴黎用户显示的答案与向香港用户显示的答案有所不同。Google 不会通过收取费用来提高网页排名,网页排名是以程序化方式完成的。
要改善您的网页呈现和排名效果,请注意以下事项:
- 提高网页加载速度,并使其适合移动设备访问。
- 在网页上发布实用的内容并保持更新。
- 遵循 Google 网站站长指南,这有助于确保提供良好的用户体验。
- 详细了解搜索引擎优化 (SEO) 新手指南中的提示和最佳实践。
- 您可以详细了解 Google 搜索的工作原理,包括我们为确保提供优质搜索结果而制定的质量评分者指南。