-
所有的算法都会有个假设前提,所有假设都是基于用户行为的分析。而算法就是把这些分析公式化。
PR算法主要基于数量假设和质量假设两个方面考虑的。
数量假设:该页面收到越多的入链(其他网页对该页面的链接称为入链),则表示该网页越重要。也就是一个好的页面肯定会获得很多其他页面的推荐。
质量假设:指向该页面的入链的质量不同,质量高的网页会通过链接传递更多的权重,越是质量高的网页指向该页面,则表示该页面越重要。也就是一个好的网页肯定也会获得其他好的网页的认同。
通过以上两个假设,PR算法刚开始会挑选一批网页作为种子网页并赋予较高的PR,通过迭代递归算法计算来更新每个页面节点的PR得分,直到得分稳定为止,即为当前页面PR得分。
PR计算出来的结果是对网页重要性的评估,作为网页排名其中的一个因素。但PR是一个全局性的算法,和具体查询无关,即和相关性无关的。PR高不能 说明该网页相关。假如搜索引擎只用PR这一算法进行排序的话,那无论你输入任何的查询词,输出的结果都是一样的,谁PR高就谁排前面。
过度追求PR的结果往往得不偿失,PR重要吗?PR不重要吗?看果园去!
对于PR来说,一个高不是高,大家高才是真的高!
PR的计算很简单,假如A网页有两个出链分别连接到B网页和C网页。假如A网页的PR值是1,那么以概率平均分配的原则,B和C网页都会平均得到 0.5值的传递。这种计算方法是建立在随机游走模型上的,随机游走模型是指假设这个网页有三个出链,用户点击每个出链的概率是一样的,所以传递的PR值也 是一样的。
由于网页之间是互相连接的,所以PR不能一直循环传递下去,否则最后所有网页的PR值都会无穷大。所以PR算法引入了衰减因子的概念,即是中转的次数越多离种子网页越远,传递的PR值越少,直到传递值为0得分稳定为止。才计算最后PR得分,加入排序结果的计算中。
另外,有些网页只有入链没有出链,那么会导致积蓄的PR值越来越高,而不能传递出去。这样会违背PR的设计初衷,影响公平性。这种结构被称为链接陷阱。
远程跳转是解决链接陷阱的通用方式,就是PR的传递并不局限于出链的传递,也可以以一定的概率向任意一个页面传递PR。
PR算法作为谷歌标志性算法,早已普遍运用到反作弊当中,即以挑选出一批作弊网页作为种子网页(挑选信任网页也亦然),给予一定的作弊分值(或信任分值),跟PR算法一样进行传递,设定一个惩罚阀值,达到则为作弊网页。
这种反作弊是基于假设:
一、如果一个网页将其链接指向作弊网页,则这个网页很可能也是作弊网页。
二、如果一个网页被作弊网页指向,则不能说明这个网页是作弊的。
当然这只是最原始的反作弊思路。研究搜索引擎算法不应该只盯着公式看,要看这个算法解决了什么问题,是基于什么样的假设,这种假设是不是符合用户行为。了解了算法的来龙去脉,才能更好的知道搜索引擎解决问题的方法。这样才是学习SEO的王道!
了解规则是为了更好的运用规则,避免违反规则受到惩罚。
作为一个文科生,我给大家最后的忠告是:珍惜生命,远离公式!!!
文章来源:光年论坛
顶: 0 踩: 0来源:卢松松博客 QQ/微信:13340454
一个文科生对于PR算法的研究
| 阅读量 | 分类: 好文分享 | 作者: 转载大师
相关文章阅读更多:Google
- 2024-04-01 油管YouTube最全教程:从注册到收款
- 2024-02-18 Google发布能自我学习能力的Gemini 1.5
- 2024-01-19 Google用AI替代广告销售工作只是开始……
- 2023-12-07 干爆ChatGPT,谷歌发布新大模型:Gemini
- 2023-06-15 Google SEO怎么做?谷歌seo优化包含哪些内容?
- 2022-10-11 Google发布文本内容生成短视频工具:Imagen Video
- 2022-10-09 Google翻译退出中国:附访问方法
- 2022-09-09 Google“有用内容更新”观察及应对
- 2022-09-04 百度和谷歌几乎同时成立,现在发展却截然不同
- 2022-04-14 一个举动让他赚了10个亿
- 2021-07-25 谷歌关闭下线Google Bookmarks书签服务
- 2021-07-10 谷歌搜索2021年7月核心算法更新
- 2021-05-26 Google搜索放弃对AMP网页特权扶持
- 2021-05-05 跨境电商之google广告投放
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
发表感想加入微信群
德州艾福莱
囧事
东北仪器网
视频监视器市场调研
英文网站字体
囧闻
品牌设计
绍兴seo
博客制作
刘印博客
龙口seo
Android开发
编程入门
山寨吧
tudou007
祝北平博客
pauljobs
记得松哥之前有一篇文章是google算法的一篇论文,依稀记得计算公式是:PR(A) = (1-d) + d (PR(T1)/C(T1) + + PR(Tn)/C(Tn))
其中d是制动因子085。当时看完文章觉得的很有道理……于是我就果断信了。
但是这篇文章说的PR的算法包含了太多的个人情感,和个人意愿在里面,看上去是一厢情愿。没有根据,没有实例,看完只能让我蛋疼不已……
至于松哥为什么要摘这样的一篇文章出来放在博客里,是因为给大家最广泛的角度审视seo吗?我觉得文章不在于多,而在于权威,像这样的文章本身和以前的文章有冲突。会降低博客的说服力……
草根站长无力的飘过……
分文网
快乐黑马
seo云南
智能手机
寻乐网线上生活杂志
电视剧
蚂蚁在线
Satine的多多洛
gleaner
网民社区
腰椎间盘突出
茅檐小博
关注
乌龟不牛
投币机
长沙阳光妇科
V9站长网
推广者博客