卢松松博客

【读图】Google 搜索背后的数据

 人参与 | 时间:2012年06月17日 11:45

对于互联网用户来说,搜索是一件非常简单的事情。在搜索框输入关键词,回车(或点击搜索框),等待。而对于搜索公司来说,这是一个复杂的技术问题。从你开始搜索到获得结果的短暂时间里,究竟发生了什么?从 Google 发给 Mashable 网站的这幅信息图里,我们可以了解到一些相关的数据。

【读图】Google 搜索背后的数据 好文分享 第1张

搜索之前

在你进行搜索之前,Google 的搜索爬虫已经走遍了整个网络,它们从一个链接跳到另一个链接,将数据带回 Google 的服务器。网络就像是一本书,Google 的工作就是为图书建立目录。

Google 建立的目录,其容量已经超过 1 亿 GB。目前为止,Google 已经花费了 100 万个机器小时来构建目录。

搜索之时

从查询开始到获得结果,搜索查询的平均旅行路程是 1500 公里。在此过程中,它可能经过全球不同的数据中心。根据 Google 的说法,1500 是一个平均数字,具体到每次搜索产生的路程不会这么长,因为 Google 总是会寻找最近的数据中心。在用户键入搜索查询的时候,Google 就开始提供对查询的预测,以减少键入时间,这就是 Google Instant。

排名

Google 的排序算法会根据 200 多个信号来决定相关结果。每年,Google 对排序算法有 500 多项改进。这些信号包括:

网页内容的新鲜程度;网站内容的质量;网页的地址和标题;其它网站对某特定站点的链接,以及这些链接的权威性;最好的搜索结果是什么,网页、图片、视频、新闻、个人结果等;网页上的单词;拼写检查;个性化(与你关联的人推荐的结果)。

搜索结果

搜索结果根据相关性排序,同时,Google 还提供了网页预览功能。

每天在 Google 上产生的搜索超过亿次;网页预览的平均加载时间是 1/10 秒;从 2003 年以来,Google 已经回答了 4500 亿个新查询;每天都有 16% 的新查询出现。

【读图】Google 搜索背后的数据 好文分享 第2张

文章来源:爱范儿

顶: 0踩: 0

来源:,欢迎分享,(QQ/微信:13340454)

原文地址:http://lusongsong.com/info/post/179.html

必填

选填

选填

◎已有 7 人评论,微信搜:QQ13340454

1楼  2013-12-25 14:57:38
节操君,你肿么了
顶: 0踩: 0 回复
2楼爱福来  2011-12-20 16:34:28
不错啊 很好啊 ,就是短了点啊
顶: 0踩: 0 回复
3楼北京工作服  2011-12-17 12:53:01
越高越复杂
估计马上要有一场大战咯
顶: 0踩: 0 回复
4楼腰椎间盘突出治疗  2012-06-19 14:26:44
为了排名,对于搜索引擎的研究真是到了非常关注的地步。当然没有兴趣也是支撑不下去的,这东西对于一般人来说还是比较枯燥的
顶: 0踩: 0 回复
5楼刘印博客  2012-06-18 17:36:11
听起来好深奥。。
顶: 0踩: 0 回复
6楼知音客  2012-06-18 11:43:14
分析的还是不够透彻,我觉得这应该是HOLD住的。
顶: 0踩: 0 回复
7楼帅男说  2012-06-18 11:13:49
拜读了
顶: 0踩: 0 回复
8楼V9站长网  2012-06-18 08:04:16
谷歌坚持对算法不断革新,通过技术来引领潮流,改变人们的生活习惯,百度则通过垄断来控制市场,高下立分。
顶: 0踩: 0 回复
9楼屠龙  2012-06-17 15:10:22
这个有点重要……
顶: 0踩: 0 回复
10楼雷东升  2012-06-17 13:15:52
属于科普文,其实我觉得搜索引擎的最大魅力就在于,它足够复杂,连谷歌内部的人都不能够完全掌控,所以对于seoer来说,才可能有规律可循
顶: 0踩: 0 回复