-
pagerank 是 google 发明的算法,用以给网页排名。它用到了概率和线性代数,但其本质很容易理解:试想一个人漫无目的的浏览网页,TA 随机点击网页上的某个链接,来到新页面后,继续随机点击新页面上的某个链接,如此循环。
给 TA 足够多时间后,根据 TA 对每个网页的访问次数,对网页排名,即访问次数越多排名越高。
这个算法是通过对网页访问的次数来估测网页质量。神奇的是,这居然 works! 这也导致 google 在当年的搜索引擎竞争中胜出。直到今天,google 挣钱仍然主要靠这一招。
对这个算法的惊人有效,bro 总是觉得有点 unreasonable,因为:
1. 人们浏览网站 is far from 随机点击链接(但或许把人类行为累积起来,宏观看来是随机的?)
2. 这种算法似乎最后获得推荐的是最 popular 网站,而不是质量最好网站 -- 两者或许有交集,但是 two very different sets. 但看搜索结果,质量还是相当好的,难道这就是人类达成共识的最 popular pages? 那我对人类还恢复了一些信心。抑或结果很受 keywords 影响,即高质量 keywords => 高质量结果?
总之,pagerank 是个神奇的算法。它把 “网页质量” 这个虚无缥缈,似乎需要 general intelligence 才能破解的问题,转化成了一个用蛮力就能解决的问题。
@bymbrofeng微博
顶: 1 踩: 0来源:卢松松博客 QQ/微信:13340454
pagerank 算法为什么 work?
| 阅读量 | 分类: 正能量 | 作者: 转载大师
相关文章阅读更多:互联网
- 2024-10-30 互联网价值输出方向 选出适合自己的路 为事业插上翅膀
- 2024-10-24 干互联网技术才是草根第一生产力!
- 2024-10-12 信息流优化师都在看的,营销师职业规划
- 2024-09-29 一个人注册50个公众号,有人靠这月入过万
- 2024-09-19 为什么电商公司老板,每过一段时间就会把运营弄离职
- 2024-09-16 马化腾开口预言下一个风口!
- 2024-09-15 十年前的BAT,到现在的BAT,谁掉队了?
- 2024-09-10 靠思域成交年赚百万,我是如何运营朋友圈的
- 2024-09-09 盘点国内浏览器,小微企业内容营销必知秘籍
- 2024-09-08 0撸越来越难,互联网赚钱何去何从?
- 2024-09-05 干互联网技术才是草根第一生产力!
- 2024-08-24 WPS套娃式会员制度让人望而却步
- 2024-08-08 网站真的没必要在做了
- 2024-08-05 未来想网络赚钱,我们该何去何从?
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
发表感想加入微信群
意意的旅行随笔
访客
挂号网
惠政号
OKmedical
创业项目
五色鱼博客
利率
英文字
IT在线
学业水平考试培训
溢瑞随笔
内涵段子
图图资源丶免费