谷歌搜索算法首席工程师阿米特·辛格(Amit Singhal)近日在谷歌官方博客网上对谷歌的搜索排名算法的原则进行了介绍,以下为辛格博客全文:
今年5月,谷歌工程副总裁尤迪·曼博(Udi Manber)对搜索质量事业部进行了介绍,该事业部主要负责对搜索结果进行排名,旗下包含多个团队。其中,曼博谈到了核心排名团队、国际搜索团队、用户界面团队和评估等其他一系列团队。在这里,我重点谈一下核心排名团队。
首先自我介绍一下,我叫阿米特.辛格,在谷歌负责搜索排名团队,在谷歌从事搜索业务已有8年。在学术界,搜索被称为信息检索。1990年我在读研究生时就开始接触搜索,做了10年信息搜索研究员后,我于2000年加盟谷歌,一直从事搜索排名工作至今。
谷歌搜素排名是一套算法,用来查找与用户查询内容相关度最高的文档。我们每天要对海量的网页进行数亿次的查询,而每一次查询都需要使用这套算法。网页搜索是访问量最高的搜索服务,但其他搜索业务也使用这套算法,如图片搜索、新闻搜索、地图搜索、产品搜索和书籍搜索等。
关于搜索排名,人们问我最多的问题是:“你们是如何做这件事情的?”当然,首先要建立一套先进的排名系统,这点我在以后会详细介绍。今天,我先简单介绍一下谷歌搜索排名:
1、全球相关性最高的搜索引擎
2、简单易用
3、无需人工干预
第一点很明显,鉴于我们对搜索业务的激情,我们绝对要确保每位用户获得相关度最高的搜索结果,我们将其称之为“不落后”原则。对于来自任何国家、任何语言的搜索,如果提供的搜索结果关联度不高,就会激励我们进行改进。
第二点也很明显,每个系统架构师不都希望自己的系统简单易用吗?搜索系统同样如此,但我们需要处理来自全世界多种语言的搜索,因此很容易使系统变得很复杂。在这方面,在保证搜索质量的前提下,我们尽量保持系统的简易性。这是一件需要持续改进的工作,也是值得做的事情。每周,我们要对排名系统进行10次改进,每一次都要确保简单性。这套简单易用的系统同时还有利于创新,事实也证明了这一点。因此,简单易用很重要。
谈到搜素排名,如果不谈“是否进行人工干预”那将是不完整的讨论。谷歌搜索算法本身就是人类智慧的结晶,但最终对搜索结果进行排名的是搜索算法,而无需人工干预。我们认为,任何个人的主观判断都具有个人主观性,因此,通过搜索算法自动排名比人工干预更适合。
此外,我们反对人工干预的第二个原因是,一次失败的查询结果就意味着我们需要对搜索算法进行改进。改进搜索算法不只是提高一次搜索查询结果,而是整个查询结果,且针对全部语言。这里还要补充一点,我们对所推荐的网站有明文规定,对于一小部分违反政策的网站我们将采取行动,如违法、具有儿童色情内容、存在病毒和恶意软件的网站等。(李明)