卢松松博客

一个文科生对于PR算法的研究

 人参与 | 时间:2012年06月13日 21:15

所有的算法都会有个假设前提,所有假设都是基于用户行为的分析。而算法就是把这些分析公式化。

PR算法主要基于数量假设和质量假设两个方面考虑的。

数量假设:该页面收到越多的入链(其他网页对该页面的链接称为入链),则表示该网页越重要。也就是一个好的页面肯定会获得很多其他页面的推荐。

质量假设:指向该页面的入链的质量不同,质量高的网页会通过链接传递更多的权重,越是质量高的网页指向该页面,则表示该页面越重要。也就是一个好的网页肯定也会获得其他好的网页的认同。

通过以上两个假设,PR算法刚开始会挑选一批网页作为种子网页并赋予较高的PR,通过迭代递归算法计算来更新每个页面节点的PR得分,直到得分稳定为止,即为当前页面PR得分。

PR计算出来的结果是对网页重要性的评估,作为网页排名其中的一个因素。但PR是一个全局性的算法,和具体查询无关,即和相关性无关的。PR高不能 说明该网页相关。假如搜索引擎只用PR这一算法进行排序的话,那无论你输入任何的查询词,输出的结果都是一样的,谁PR高就谁排前面。

过度追求PR的结果往往得不偿失,PR重要吗?PR不重要吗?看果园去!

对于PR来说,一个高不是高,大家高才是真的高!

PR的计算很简单,假如A网页有两个出链分别连接到B网页和C网页。假如A网页的PR值是1,那么以概率平均分配的原则,B和C网页都会平均得到 0.5值的传递。这种计算方法是建立在随机游走模型上的,随机游走模型是指假设这个网页有三个出链,用户点击每个出链的概率是一样的,所以传递的PR值也 是一样的。

由于网页之间是互相连接的,所以PR不能一直循环传递下去,否则最后所有网页的PR值都会无穷大。所以PR算法引入了衰减因子的概念,即是中转的次数越多离种子网页越远,传递的PR值越少,直到传递值为0得分稳定为止。才计算最后PR得分,加入排序结果的计算中。

另外,有些网页只有入链没有出链,那么会导致积蓄的PR值越来越高,而不能传递出去。这样会违背PR的设计初衷,影响公平性。这种结构被称为链接陷阱。

远程跳转是解决链接陷阱的通用方式,就是PR的传递并不局限于出链的传递,也可以以一定的概率向任意一个页面传递PR。

PR算法作为谷歌标志性算法,早已普遍运用到反作弊当中,即以挑选出一批作弊网页作为种子网页(挑选信任网页也亦然),给予一定的作弊分值(或信任分值),跟PR算法一样进行传递,设定一个惩罚阀值,达到则为作弊网页。

这种反作弊是基于假设:

一、如果一个网页将其链接指向作弊网页,则这个网页很可能也是作弊网页。

二、如果一个网页被作弊网页指向,则不能说明这个网页是作弊的。

当然这只是最原始的反作弊思路。研究搜索引擎算法不应该只盯着公式看,要看这个算法解决了什么问题,是基于什么样的假设,这种假设是不是符合用户行为。了解了算法的来龙去脉,才能更好的知道搜索引擎解决问题的方法。这样才是学习SEO的王道!

了解规则是为了更好的运用规则,避免违反规则受到惩罚。

作为一个文科生,我给大家最后的忠告是:珍惜生命,远离公式!!!

文章来源:光年论坛

顶: 0踩: 0

来源:,欢迎分享,(QQ/微信:13340454)

原文地址:http://lusongsong.com/info/post/175.html

必填

选填

选填

◎已有 33 人评论,微信搜:QQ13340454

1楼囧事  2014-02-17 20:57:04
又涨姿势了
顶: 0踩: 0 回复
2楼东北仪器网  2013-11-20 10:05:14
百度
顶: 0踩: 0 回复
3楼视频监视器市场调研  2013-03-20 15:31:24
内容比较简短
顶: 0踩: 0 回复
4楼英文网站字体  2014-02-12 14:37:52
我也是文科生,可是我不这么认为
顶: 0踩: 0 回复
5楼囧闻  2014-01-10 18:57:28
这个文科生真不简单呀
顶: 0踩: 0 回复
6楼pauljobs  2012-06-14 16:07:35
写到最后,我想说,你站在一个文科生的立场想说明一个道理,首先你就把自己孤立了,你把你的读者分群化了。这让理科读者心里总会有点莫名的不爽。再者,这篇文章你让理科生打断相信公式的做法,额……只能说,作为一个理科生我更相信公式,比起相信自己的感觉来说。over!
顶: 0踩: 0 回复
7楼品牌设计  2012-06-16 10:46:06
分析的有条理啊。但是分析归分析,还要看实际情况
顶: 0踩: 0 回复
8楼绍兴seo  2012-06-16 10:15:15
作为一名理科生,我还是相信公式应该有他的权威性,不然出来公式干嘛,一句话,不能全盘否定!
顶: 0踩: 0 回复
9楼博客制作  2012-06-15 10:38:15
这篇文章让我对谷歌PR有些新的认识。
顶: 0踩: 0 回复
10楼刘印博客  2012-06-15 06:59:12
不关注PR的路过~
顶: 0踩: 0 回复
11楼龙口seo  2012-06-14 23:14:33
如果是看了大量的资料以后,写出这样的文章来,不觉得奇怪吧。初级的SEOer都能写出来的。只要看了GOOGLE 的站长指南就能写出来。
顶: 0踩: 0 回复
12楼Android开发  2012-06-14 22:34:00
文科生并不是都不喜欢公式什么的吧,理科生也不一定喜欢研究这些东西
顶: 0踩: 0 回复
13楼编程入门  2012-06-14 22:33:01
这些是PR算法的基础知识,做seo不能不知道这些
顶: 0踩: 0 回复
14楼山寨吧  2012-06-14 18:26:53
这个PR 我一直没搞懂这些玩意
顶: 0踩: 0 回复
15楼tudou007  2012-06-14 17:05:25
哎 看到就头疼 不过还是要去学学啊
顶: 0踩: 0 回复
16楼祝北平博客  2012-06-14 17:01:15
专业 人才 就是 牛x
顶: 0踩: 0 回复
17楼pauljobs  2012-06-14 16:03:14
看完这篇文章我心理久久不能平静……真不知道说什么好。
记得松哥之前有一篇文章是google算法的一篇论文,依稀记得计算公式是:PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
其中d是制动因子0.85。当时看完文章觉得的很有道理……于是我就果断信了。
但是这篇文章说的PR的算法包含了太多的个人情感,和个人意愿在里面,看上去是一厢情愿。没有根据,没有实例,看完只能让我蛋疼不已……
至于松哥为什么要摘这样的一篇文章出来放在博客里,是因为给大家最广泛的角度审视seo吗?我觉得文章不在于多,而在于权威,像这样的文章本身和以前的文章有冲突。会降低博客的说服力……
草根站长无力的飘过……
顶: 0踩: 0 回复
18楼分文网  2012-06-14 15:54:49
算得再清楚 也左右不了google
顶: 0踩: 0 回复
19楼快乐黑马  2012-06-14 15:43:28
看到pr。想到rp。文科生厉害
顶: 0踩: 0 回复
20楼seo云南  2012-06-14 14:00:37
这个文科生真不简单呀
顶: 0踩: 0 回复
21楼智能手机  2012-06-14 13:36:36
不是很懂。
顶: 0踩: 0 回复
22楼寻乐网线上生活杂志  2012-06-14 11:59:58
作为一个文科生,我给大家最后的忠告是:珍惜生命,远离公式!!! 哈哈,是不是作为理科生就是亲近公式了????
顶: 0踩: 0 回复
23楼电视剧  2012-06-14 11:32:28
太厉害 逻辑很清晰
顶: 0踩: 0 回复
24楼蚂蚁在线  2012-06-14 10:13:06
文科生很强大
顶: 0踩: 0 回复
25楼Satine的多多洛  2012-06-14 09:55:52
不要把PR看的那么重,把网站做好才是硬道理
顶: 0踩: 0 回复
26楼gleaner  2012-06-14 09:44:31
分析的很犀利啊!一个字一个字的看过来的
顶: 0踩: 0 回复
27楼华子SEO博客  2012-06-14 09:39:21
珍惜生命,远离公式
顶: 0踩: 0 回复
28楼网民社区  2012-06-14 08:57:30
学习中,pr怎么升
顶: 0踩: 0 回复
29楼腰椎间盘突出  2012-06-14 08:43:18
叫文科生来算公式真是难为了。在懂得原理的基础上,归根到底还是要做用户身上去
顶: 0踩: 0 回复
30楼茅檐小博  2012-06-14 08:18:49
公式还是要懂的,但是不能生搬硬套。
顶: 0踩: 0 回复
31楼关注  2012-06-14 06:32:49
自己研究的?还是看过ZAC的文章伪原创的吧
顶: 0踩: 0 回复
32楼时光的线条  2012-06-14 00:51:47
我擦 好复杂
顶: 0踩: 0 回复
33楼乌龟不牛  2012-06-14 00:42:54
随它怎么折腾
顶: 0踩: 0 回复
34楼投币机  2012-06-14 00:21:17
算法真的能研究出来?
顶: 0踩: 0 回复
35楼长沙阳光妇科  2012-06-14 00:00:44
学习之~~~~~~·
顶: 0踩: 0 回复
36楼V9站长网  2012-06-13 23:02:35
不要研究这些,做好网站内容,你看松哥,这么多人来看他网站
顶: 0踩: 0 回复
37楼推广者博客  2012-06-13 21:35:08
我就不懂公式,由其是数学。
顶: 0踩: 0 回复