此算法被用作googlePR算法的一部分 是翻译的一篇外国英文文章:
假设一个概率q:为用户进入一个随机抽取的网页的概率 (取值为0.15)
1-q: 为用户进入当前网页后点当前网页超链接的概率
进一步假设用户不回溯先前访问的网页,这个过程可以通过构造马尔可夫链来实现。于是每个访问的网页的概率就可以算出来。
设C(a)为a网页包含的超链接数量,也就是outing link .
设p1到pn为指向网页a的网页标识 。
于是网页a的PR值为:
PR(a)=q+ (1-q){ 西格玛i从1到n [PR(Pi)/C(Pi)] }
通过公式可以看出C(Pi)的值是已知的,也就是说前人已经算好了 。
网页的PR值作用是:Crawling可以根据网页的PR值去抓优质的网页。
所以可以看出网页设计者应该设计描述性强的网页标题,头信息,原数据,和好的超链接。
希望以上能给大家带来新知识,这次PR大更新已经临近,希望大家的PR和站一样蒸蒸日上!