一直以来经常有些客户会问到这样一个问题: Google搜索引擎的搜索结果是根据什么因素来确定它的排名然后进行合理的排序的? 最近google优化直接又重新从Google.com官方网站上找了份权威资料,下面是引用原文来解释谷歌的搜索结果排序的问题:
当您坐在计算机前开始 Google.cn 谷歌搜索时,整个网络的搜索结果列表几乎在一瞬间便呈现在您的眼前。 那么Google 谷歌是如何查找与您的查询匹配的网页,又是如何确定搜索结果的顺序的?
用最简单的话来说,您可以将在网络上搜索的过程想象为在一本非常大的书中查找信息,而该书具有完备的索引,可告诉您各种信息所在的准确位置。 在您进行 Google推广 搜索时,我们的程序会检查索引,以确保将最相关的搜索结果返回("提供")给您。
提交搜索结果包含三个主要过程:
抓取:Google 了解您的网站吗? 我们能够找到它吗?
编制索引:Google 会为您的网站编制索引吗?
服务:网站是否包含与用户搜索相关的好而实用的内容?
抓取
抓取是 Googlebot 发现新网页和经过更新的网页的过程,这些网页会被添加到 Google 索引中。
我们使用大量的计算机获取(或"抓取")数十亿网页。 进行此提取工作的程序被称为 Googlebot(也称为漫游器或抓取工具)。 Googlebot 使用算法流程:计算机程序确定要抓取哪些网站、抓取的频率,以及从每个网站中提取的网页数量。
Google 抓取过程的起始点是一个网页网址列表,它是在之前的抓取过程中生成的,并使用网站管理员提供的 Sitemap 数据进行了扩充。 在 Googlebot 访问这些网站时,它会检测每个网页上的链接,并将其添加到要抓取的网页列表中。 新出现的网站、现有网站的更改和无效链接将被记录下来,并用于更新 Google 索引。
Google 不接受以付费的方式来提高网站抓取频率。我们会将搜索业务和以盈利为目的的 AdWords 服务严格分开。
编制索引
Googlebot 会处理所抓取的每个网页,以便将其看到的所有字词和每个网页的位置都编制到大型索引中。 此外,我们还处理包含在关键内容标记和属性中的信息,例如 Title(标题)标记和 ALT(替代)属性。 Googlebot 可以处理许多类型的内容,但不是全部类型的内容。 例如,我们无法处理一些富媒体文件或动态网页的内容。
提供结果
用户输入查询时,我们的计算机搜索索引查找匹配网页,并返回我们认为与用户搜索最相关的结果。 相关性由 200 多个因素确定,其中之一即特定网页的 PageRank。 PageRank 根据其他网页的内部链接对一个网页的重要性进行衡量。 简单来说,其他网站对您网站网页的各个链接构成您网站的 PageRank。 并非所有链接都具有同等价值:Google 致力于通过确认垃圾链接和其他对搜索结果造成负面影响的行为来改善用户体验。 最好的链接应基于您提供的内容的质量。
要让网站在搜索结果页中获得较好的排名,很重要的一点是要确保 Google 能正确抓取您的网站并将其编入索引。