搜索引擎工作的基础流程与原理

| 阅读量 | 分类: SEO推广 | 作者: 读者投稿 | 时间：2012年09月01日 10:17

感谢Mr.Zhao的投稿：

搜索引擎最重要的是什么?有人会说是查询结果的准确性，有人会说是查询结果的丰富性，但其实这些都不是搜索引擎最最致命的地方。对于搜索引擎来说，最最致命的是查询时间。试想一下，如果你在百度界面上查询一个关键词，结果需要5分钟才能将你的查询结果反馈给你，那结果必然是你很快的舍弃掉百度。

搜索引擎为了满足对速度苛刻的要求(现在商业的搜索引擎的查询时间单位都是微秒数量级的)，所以采用缓存支持查询需求的方式，也就是说我们在查询搜索时所得到的结果并不是及时的，而是在其服务器已经缓存好了的结果。那么搜索引擎工作的大体流程是什么样子呢?我们可以理解为三段式。

本文仅仅是对着三段工作流程进行大体上的讲解与综述，其中一些详细的技术细节将会用其它的文章进行单独的讲解。

一.网页搜集。

网页搜集，其实就是大家常说的蜘蛛抓取网页。那么对于蜘蛛(google称之为机器人)来说，他们感兴趣的页面分为三类：

1.蜘蛛从未抓去过的新页面。

2.蜘蛛抓去过，但页面内容有改动的页面。

3.蜘蛛抓取过，但现在已删除了的页面。

那么如何行之有效的发现这三类页面并进行抓取，就是spider程序设计的初衷与目的。那么这里就涉及到一个问题，蜘蛛抓取的起始点。

每一位站长只要你的网站没有被严重降权，那么通过网站后台的服务器，你都可以发现勤劳的蜘蛛光顾你的站点，但是你们有没有想过从编写程序的角度上来说，蜘蛛是怎么来的呢?针对于此，各方有各方的观点。有一种说法，说蜘蛛的抓取是从种子站(或叫高权重站)，依照权重由高至低逐层出发的。另一种说法蜘蛛爬在URL集合中是没有明显先后顺序的，搜索引擎会根据你网站内容更新的规律，自动计算出何时是爬取你网站的最佳时机，然后进行抓取。

其实对于不同的搜索引擎，其抓取出发点定然会有所区别，针对于百度，Mr.Zhao较为倾向于后者。在百度官方博客发布的《索引页链接补全机制的一种办法》(地址：http://stblog.baidu- tech.com/?p=2057)一文中，其明确指出“spider会尽量探测网页的发布周期，以合理的频率来检查网页”，由此我们可以推断，在百度的索引库中，针对每个URL集合，其都计算出适合其的抓取时间以及一系列参数，然后对相应站点进行抓取。

在这里，我要说明一下，就是针对百度来说，site的数值并非是蜘蛛已抓取你页面的数值。比如site:www.seozhao.com，所得出的数值并不是大家常说的百度收录数值，想查询具体的百度收录量应该在百度提供的站长工具里查询索引数量。那么site是什么?这个我会在今后的文章中为大家讲解。

那么蜘蛛如何发现新链接呢?其依靠的就是超链接。我们可以把所有的互联网看成一个有向集合的聚集体，蜘蛛由起始的URL集合A沿着网页中超链接开始不停的发现新页面。在这个过程中，每发现新的URL都会与集合 A中已存的进行比对，若是新的URL，则加入集合A中，若是已在集合A中存在，则丢弃掉。蜘蛛对一个站点的遍历抓取策略分为两种，一种是深度优先，另一种就是宽度优先。但是如果是百度这类商业搜索引擎，其遍历策略则可能是某种更加复杂的规则，例如涉及到域名本身的权重系数、涉及到百度本身服务器矩阵分布等。

二.预处理。

预处理是搜索引擎最复杂的部分，基本上大部分排名算法都是在预处理这个环节生效。那么搜索引擎在预处理这个环节，针对数据主要进行以下几步处理：

1.提取关键词。

蜘蛛抓取到的页面与我们在浏览器中查看的源码是一样的，通常代码杂乱无章，而且其中还有很多与页面主要内容是无关的。由此，搜索引擎需要做三件事情：?代码去噪。去除掉网页中所有的代码，仅剩下文本文字。②去除非正文关键词。例如页面上的导航栏以及其它不同页面共享的公共区域的关键词。③去除停用词。停用词是指没有具体意义的词汇，例如“的”“在”等。

当搜索引擎得到这篇网页的关键词后，会用自身的分词系统，将此文分成一个分词列表，然后储存在数据库中，并与此文的URL进行一一对应。下面我举例说明。

假如蜘蛛爬取的页面的URL是http://www.seozhao.com/2.html，而搜索引擎在此页面经过上述操作后提取到的关键词集合为p，且p是由关键词p1,p2,……,pn组成，则在百度数据库中，其相互间的关系是一一对应，如下图。

2.消除重复与转载网页。

每个搜索引擎其识别重复页面的算法均不相同，但是其中 Mr.Zhao认为，如果将消重算法理解为由100个元素组成，那么所有的搜索引擎恐怕其80个元素都是完全一样的。而另外20个元素，则是根据不同的搜索引擎针对seo的态度不同，而专门设立的对应策略。本文仅对搜索引擎大体流程进行初步讲解，具体数学模型不多做讲解。

3.重要信息分析。

在进行代码除噪的过程中，搜索引擎并非简单的将其去除掉而已，而是充分利用网页代码(例如H标签、strong标签)、关键词密度、内链锚文本等方式分析出此网页中最重要的词组。

4.网页重要度分析。

通过指向该网页的外链锚文本所传递的权重数值，来为此网页确定一个权重数值，同时结合上述的“重要信息分析”，从而确立此网页的关键词集合p中每一个关键词所具备的排名系数。

5.倒排文件。

正如上文所说，用户在查询时所得到的查询结果并非是及时的，而是在搜索引擎的缓存区已经大体排好的，当然搜索引擎不会未卜先知，他不会知道用户会查询哪些关键词，但是他可以建立一个关键词词库，而当其处理用户查询请求的时候，会将其请求按照词库进行分词。那么这样下来，搜索引擎就可以在用户产生查询行为之前，将词库中的每一个关键词其对应的URL排名先行计算好，这样就大大节省了处理查询的时间了。

简单来说，搜索引擎用控制器来控制蜘蛛爬取，然后将URL集与原始数据库进行保存，保存之后再用索引器控制每个关键词与URL之间的对应关系，并将其保存在索引数据库中。

下面我们来举例说明。

假若http://www.seozhao.com/2.html页面被切词成p={p1，p2，p3，……，pn}，则其在索引数据库中由下图方式体现。

上图是为了方便大家便于理解而做出来的，索引数据库实际上是搜索引擎中对性能要求最高的数据库，因为里面所有因素都会受到算法影响，所以实际上的索引数据库我觉得应该是由多维数组所组成的较为复杂的索引表，但其主要体现的大体作用与上图相同。

三、查询服务。

查询服务顾名思义，就是处理用户在搜索界面的查询请求。搜索引擎构建检索器，然后分三步来处理请求。

1.根据查询方式与关键词进行切词。

首先先把用户搜索的关键词切分为一个关键词序列，我们暂时用q来表示，则用户搜索的关键词q被切分为q={q1，q2，q3，……，qn}。

然后再根据用户查询方式，例如是所有词连在一起，还是中间有空格等，以及根据q中不同关键词的词性，来确定所需查询词中每一个词在查询结果的展示上所占有的重要性。

2.搜索结果排序。

我们有了搜索词集合q，q中每个关键词所对应的URL排序——索引库，同时也根据用户的查询方式与词性计算出每个关键词在查询结果的展示上所占有的重要，那么只需要进行一点综合性的排序算法，搜索结果就出来了。

3.展示搜索结果与文档摘要。

当有了搜索结果后，搜索引擎就会将搜索结果展示在用户阅览的界面上以供用户使用。

在这里，大家可以思考两个个问题。

?大家在搜索界面中经常发现百度展示的摘要是用户搜索词周围的，如果我不仅仅只看第一页，多往后翻一些页，会看到有些结果由于其目标页面本身并未完全包含搜索词，而在百度提取的摘要中标红词仅是部分搜索词，那么我们可以这样理解，百度在搜索词不被完全包含的情况下，是不是应该优先展现在分词结果中被百度认为较为重要的词呢?那么从这些搜索结果中我们是不是就可以看出百度分词算法的部分端倪呢?

②有时候页面中会多次出现搜索词，而百度搜索结果页面中在网站摘要部分仅会显示部分，通常这么部分是连续的，那我们是不是可以理解在摘要部分，百度会优先展示页面中它认为与对此搜索词最重要的部分呢?那么由此我们是不是可以揣度出百度针对页面除噪后对不同部分赋予权重的算法呢?

这两个问题仁者见仁智者见智，做SEO的朋友们自己去探索与摸索吧，Mr.Zhao不敢在此误人子弟。

四、现今百度的流程漏洞。

请原谅我用流程漏洞来形容这个模块，但我不得不说，在如今点击器横行的天下，我觉得说是漏洞无可厚非。

那就是除了上面三个大环节外，百度还构建了用户行为模块，来影响原始数据库与索引库。而影响原始数据库的，是百度的快照投诉，主要处理互联网暴利的一些行为，这点无可厚非。而影响索引库的，是用户的点击行为，这个设计本身也无可厚非，但百度算法的不成熟，导致了点击器作弊猖獗。

百度的用户行为分析模块很简单，除了自身投诉的提交入口外，就是搜集用户在搜索界面的点击行为，如果此页面结果被大部分用户阅览，但没有产生点击，用户居然大部分选择点击第二页甚至更后面的页面，则此现象就会被百度工程师们所知道，则会根据这方面来微调算法。如今百度针对不同行业，其算法早已不同了。

如果前两页内某个搜索界面被大量用户选择点击，则通常会在24小时候，这个搜索结果被大幅前提，甚至会被提升至第一名。

五、搜索引擎大体流程图(加上用户行为分析器)

以上就是我所对搜索引擎工作的基础流程与原理的理解。

最后我想说

广大的SEO从业者们应该已经发现无论是百度还是谷歌或者其它的商业搜索引擎，他们都会要求seoer们不要去在意算法、不要去在意搜索引擎，而是去多关注用户体验。这里我们可以理解成一个比喻，搜索引擎是买西瓜的人，而SEO们是种西瓜的人，买西瓜的人要求我们这些种西瓜的人不要关心他们挑选西瓜的标准，而是多多在意怎么去种出好西瓜，而对于什么样的西瓜是他们需要的好西瓜，他们又往往用一些模糊的概念掩盖过去。诚然，这样搜索引擎得到的结果将会多样化，他们可以在挑选结果时有更多的选择，能够最大限度的维护这些商业搜索引擎自身的利益，但是请其也不要忘记，我们这些种西瓜的也要有口饭吃。

顶: 16 踩: 6

来源：卢松松博客 QQ/微信：13340454 ，转载请注明出处！

本文地址：https://lusongsong.com/reed/529.html

发表感想加入微信群

热门跟帖

阳光房

写的真好，不过现在百度发布了几个算法，很多网站都受到了很多的影响，百度越来越智能化，对于原创作者而言是福音。

评论来自电脑端时间:2017-12-14 09:07:14

顶: 1 踩: 0 回复

2楼

指纹密码锁

求各位大神指教指教啊

评论来自电脑端时间:2016-05-25 14:18:07

顶: 2 踩: 0 回复

3楼

四物汤标准配方

排名的原因有很多，能做好一点就够了。

评论来自电脑端时间:2016-02-13 14:23:04

顶: 2 踩: 0 回复

4楼

epson维修

非常好的创意呀

评论来自电脑端时间:2015-12-21 14:38:41

顶: 1 踩: 0 回复

5楼

宜鑫宜益

很深度，受益匪浅了解一下先。

评论来自电脑端时间:2015-11-23 17:39:35

顶: 1 踩: 0 回复

6楼

知名兽药厂家

这些东西好像根基，透彻了才能为所欲为

评论来自电脑端时间:2015-06-25 18:33:13

顶: 1 踩: 0 回复

7楼

知名兽药厂家

其实我想说的是，能写出这种文章的人，做seo已经很轻松了

评论来自电脑端时间:2015-06-25 18:31:28

顶: 1 踩: 0 回复

8楼

彭某某

写得还可以，对于搜索引擎来说太庞大了，要深入了解的确要大量时间研究。

评论来自电脑端时间:2015-06-15 21:33:56

顶: 1 踩: 0 回复

9楼

彭某某

说得相当不错，但是对于我来说搜索引擎要花大量时间研究。

评论来自电脑端时间:2015-06-15 21:33:23

顶: 1 踩: 0 回复

10楼

tomhua学堂

对我来说有价值，希望以后可以有更多这样的文章出炉、！

评论来自电脑端时间:2015-02-26 18:38:14

顶: 1 踩: 0 回复

11楼

癌症康复免费咨询中心

最后面说的好形象，哭~~~~

评论来自电脑端时间:2014-12-05 23:51:26

顶: 0 踩: 0 回复

12楼

防辐射孕妇装

作者对搜索引擎还是有很深入的理解，写得很不错的。搜索引擎只知道要好东西，但并不告诉你好东西的确切标准。

评论来自电脑端时间:2014-11-25 08:08:56

顶: 0 踩: 0 回复

13楼

内涵图

很深度，受益匪浅了解一下先。

评论来自电脑端时间:2013-12-28 01:57:40

顶: 0 踩: 0 回复

14楼

worry

worry有些不太理解

评论来自电脑端时间:2013-01-22 11:46:10

顶: 0 踩: 0 回复

15楼

worry

是的种西瓜的不是神仙也要吃饭的啊不过没办法我们要靠卖西瓜的过活

评论来自电脑端时间:2013-01-22 11:33:32

顶: 0 踩: 0 回复

16楼

乐事网

博主用心了

评论来自电脑端时间:2012-12-12 13:48:07

顶: 0 踩: 0 回复

17楼

郑州悦美整形

种西瓜和买西瓜比喻很精辟！

评论来自电脑端时间:2012-11-30 16:20:15

顶: 0 踩: 0 回复

18楼

没印象

请问蜘蛛为什么喜欢抓取被删除的页面呢

评论来自电脑端时间:2012-11-20 16:52:31

顶: 0 踩: 0 回复

19楼

郝剑波博客

我认可百度蜘蛛就是在定期抓文章，而不是依照权重由高到低。

评论来自电脑端时间:2012-10-06 16:40:07

顶: 0 踩: 0 回复

20楼

木木工作室

新站如何引起搜索引擎的胃口呢

评论来自电脑端时间:2012-09-25 14:58:05

顶: 0 踩: 0 回复

21楼

博客优化

写的不错，知道该怎么下手了，嘻嘻

评论来自电脑端时间:2012-09-25 11:54:53

顶: 0 踩: 0 回复

22楼

免费资源

每天过来看一看。

评论来自电脑端时间:2012-09-23 22:01:50

顶: 0 踩: 0 回复

23楼

陈松松视频营销

今天才知道搜索原理原来是这样的啊！

评论来自电脑端时间:2012-09-18 22:38:37

顶: 0 踩: 0 回复

24楼

第三代搜索

基础知识，这是SEOer必须了解的

评论来自电脑端时间:2012-09-17 13:26:04

顶: 0 踩: 0 回复

25楼

开心不易

写的不错，很有深度，学习了！

评论来自电脑端时间:2012-09-15 21:41:45

顶: 0 踩: 0 回复

26楼

T.n.T

了解一些运行机制~

评论来自电脑端时间:2012-09-15 10:46:22

顶: 0 踩: 0 回复

27楼

门业人才网

有竟争才有成长嘛，有竟争才能推动社会进步！小周还是不错滴

评论来自电脑端时间:2012-09-13 14:28:17

顶: 0 踩: 0 回复

28楼

单纯的码农

搜索引擎需要更多的竞争，360搜索起来了，有道、搜搜、搜狗也要起来，有竞争才会推动发展，才会有利于广大网民。

评论来自电脑端时间:2012-09-12 20:28:59

顶: 0 踩: 0 回复

29楼

德尚U盘礼品

讲解很好，值得参考

评论来自电脑端时间:2012-09-11 20:43:37

顶: 0 踩: 0 回复

30楼

职业装

卢哥的文章的确每次写的都很经典呀！！！不错不错这篇写的很用的到,学习了！

评论来自电脑端时间:2012-09-11 09:46:48

顶: 0 踩: 0 回复

31楼

星光博客

略懂略懂

评论来自电脑端时间:2012-09-10 21:30:01

顶: 0 踩: 0 回复

32楼

水源热泵的特点

然后对相应站点进行抓取。

评论来自电脑端时间:2012-09-10 17:03:47

顶: 0 踩: 0 回复

33楼

南京东大医院

楼主太伟大了

评论来自电脑端时间:2012-09-10 16:20:24

顶: 0 踩: 0 回复

34楼

洋子博客

这个原理在《seo实战密码》里面看过哦

评论来自电脑端时间:2012-09-10 09:44:48

顶: 0 踩: 0 回复

35楼

广州妇科医院

说得不错，还是要了解下搜索引擎的原理，比喻很不错啊，我们也要吃饭的。

评论来自电脑端时间:2012-09-08 11:46:15

顶: 0 踩: 1 回复

36楼

贴片晶振

不告诉我们需要什么样的好西瓜那就只能猜、、你猜来猜去也猜不明白、、、

评论来自电脑端时间:2012-09-07 15:25:54

顶: 0 踩: 0 回复

37楼

武汉seo博客

seo从业者了解一定要搜索引擎原理是必须的！

评论来自电脑端时间:2012-09-07 12:51:29

顶: 0 踩: 0 回复

38楼

李鸣

搜索引擎原理，不错的东西。值得仔细研读

评论来自电脑端时间:2012-09-05 16:11:44

顶: 0 踩: 0 回复

39楼

睡眠健康网www.52sleep.net

如果搜索引擎真的可以做到像人的眼光一样准，那也就没有SEO的空间和必要了。。。所以只要它还不成熟一天，就一定会有人利用它的漏洞。。。

评论来自电脑端时间:2012-09-04 21:42:58

顶: 0 踩: 0 回复

40楼

志新化工商务网

说的、分析的都很到位，看的太认真，眼疼了。。。

评论来自电脑端时间:2012-09-04 17:16:41

顶: 0 踩: 0 回复

41楼

默涵

关于搜索引擎原理的书籍很多，这也是大部分书籍所阐述的部分，不过个人感觉算法背后仍然有很多不为站长所知的东西，毕竟搜索引擎的发展有十多年了，算法也一直在更新。

评论来自电脑端时间:2012-09-04 16:50:37

顶: 0 踩: 0 回复

42楼

大荣

很深度，受益匪浅

评论来自电脑端时间:2012-09-04 09:27:57

顶: 0 踩: 0 回复

43楼

seo博客

了解好搜索引擎的工作原理才能更有效的去做引擎seo

评论来自电脑端时间:2012-09-04 09:23:24

顶: 0 踩: 0 回复

44楼

低价建站

学习了又增加了知识

评论来自电脑端时间:2012-09-04 08:32:50

顶: 0 踩: 0 回复

45楼

脚气好啦

这个在百度搜索引擎优化指南里面都有写吧

评论来自电脑端时间:2012-09-03 21:29:20

顶: 0 踩: 0 回复

46楼

tomwilson

瓜农也要学习，，瓜农也是要有技术含量地。。不然不好混咯

评论来自电脑端时间:2012-09-03 16:27:20

顶: 0 踩: 0 回复

47楼

请叫我韵

赞一个，对瓜农来说了解什么才是好瓜的确重要。

评论来自电脑端时间:2012-09-03 10:32:55

顶: 0 踩: 0 回复

48楼

淘开心

搜索引擎为了满足对速度苛刻的要求(现在商业的搜索引擎的查询时间单位都是微秒数量级的)，所以采用缓存支持查询需求的方式，也就是说我们在查询搜索时所得到的结果并不是及时的，而是在其服务器已经缓存好了的结果。

评论来自电脑端时间:2012-09-03 10:25:59

顶: 0 踩: 0 回复

49楼

易亦义

嗯。一下还不怎么懂，要多看几次才明白一些东西。

评论来自电脑端时间:2012-09-03 09:34:34

顶: 0 踩: 0 回复

50楼

叉车

不错啊，多谢分享

评论来自电脑端时间:2012-09-03 08:50:44

顶: 0 踩: 0 回复

51楼

吴克难的博客

学习搜索技巧可以大幅度提高自身能力。

评论来自电脑端时间:2012-09-03 08:22:19

顶: 0 踩: 0 回复

52楼

觉梦博客

不错扫盲了

评论来自电脑端时间:2012-09-03 08:06:30

顶: 0 踩: 0 回复

53楼

旅途者

讲的很详细，非常感谢博主的用心总结，受益

评论来自电脑端时间:2012-09-03 06:38:34

顶: 0 踩: 0 回复

54楼

超级医生

搜索引擎原来远不止如此简单，但我们只要掌握其基本准则对优化而言已经是非常有帮助的。

评论来自电脑端时间:2012-09-03 05:16:10

顶: 0 踩: 0 回复

55楼

广州金蝶软件销售服务中心

卖西瓜种西瓜的比喻非常贴切到位

评论来自电脑端时间:2012-09-02 23:02:00

顶: 0 踩: 0 回复

56楼

官橙宝

看过文章后最后一段话比喻很恰当

评论来自电脑端时间:2012-09-02 23:00:10

顶: 0 踩: 0 回复

57楼

好运鞋网

真的是好复杂啊，看的有点晕，但又有点明白似的。多看几遍可能就懂了。

评论来自电脑端时间:2012-09-02 22:46:44

顶: 0 踩: 0 回复

58楼

长沙SEO

蜘蛛抓取到的页面与我们在浏览器中查看的源码是一样的，通常代码杂乱无章，而且其中还有很多与页面主要内容是无关的。

评论来自电脑端时间:2012-09-02 22:42:22

顶: 0 踩: 0 回复

59楼

哈伦裤

这个看了多遍了，不好看，建议松松不要放这样的文章出来。没质量

评论来自电脑端时间:2012-09-02 22:12:36

顶: 0 踩: 0 回复

60楼

石家庄旅游景点大全

这次明白了

评论来自电脑端时间:2012-09-02 21:56:05

顶: 0 踩: 0 回复

61楼

潮乐购

技术文章啊。。没耐心看呢

评论来自电脑端时间:2012-09-02 21:47:22

顶: 0 踩: 0 回复

62楼

喜鱼网

又学习了，是要一口饭吃啊。

评论来自电脑端时间:2012-09-02 21:16:45

顶: 0 踩: 0 回复

63楼

85女性网

百度最稀烂那些大网站到处抄袭没事专K那些个人站长这什么标准呢？

评论来自电脑端时间:2012-09-02 21:13:46

顶: 0 踩: 0 回复

64楼

广州离婚律师

专业，做网站的首先要了解原理,,,,,

评论来自电脑端时间:2012-09-02 20:25:49

顶: 0 踩: 0 回复

65楼

吧嗒咚咚

互联网奥妙着呢！

评论来自电脑端时间:2012-09-02 20:24:53

顶: 0 踩: 0 回复

66楼

吧嗒咚咚

了解一下先。

评论来自电脑端时间:2012-09-02 20:24:30

顶: 0 踩: 0 回复

67楼

蓝颜

这个就有点高深了，玄机重重

评论来自电脑端时间:2012-09-02 19:13:43

顶: 0 踩: 0 回复

68楼

闵非凡博客

知道了这个原理，就能迎合各种搜索蜘蛛来SEO了，呵呵。

评论来自电脑端时间:2012-09-02 18:47:22

顶: 0 踩: 0 回复

69楼

买衣服网

站长辛苦了，突然发现这里。看的出来你付出了大量心血和汗水，文章写得非常好，值得我们草根学习，赞一个。

评论来自电脑端时间:2012-09-02 16:22:33

顶: 0 踩: 0 回复

70楼

木吉他价格

增长知识啦！！还是要了解下的

评论来自电脑端时间:2012-09-02 16:03:06

顶: 0 踩: 0 回复

71楼

素食趣

很好，如果再写点我们小站长该怎么做就更好了。
百度的site不是收录量嘛？那百度的site的意义是什么呢？

评论来自电脑端时间:2012-09-02 15:10:23

顶: 0 踩: 0 回复

72楼

男装

看的一知半解的，回去再看看·~好好研究一下

评论来自电脑端时间:2012-09-02 15:01:00

顶: 0 踩: 0 回复

73楼

夹角网

老大，你太牛逼了！这么长的文章，还写得这样好！佩服！

评论来自电脑端时间:2012-09-02 14:44:16

顶: 0 踩: 0 回复

74楼

李金龙

应该再加上360那可笑的抓取方式！

评论来自电脑端时间:2012-09-02 14:24:54

顶: 0 踩: 0 回复

75楼

分类信息网

seo原理还是不会太大变化的

评论来自电脑端时间:2012-09-02 14:18:42

顶: 0 踩: 0 回复

76楼

SEM实战密码

好东西啊正在找这方面的资料呢

评论来自电脑端时间:2012-09-02 13:46:46

顶: 0 踩: 0 回复

77楼

福建seo陈小舟

文章写的不错，看了评论，可以看出干货大家都喜欢啊

评论来自电脑端时间:2012-09-02 13:21:50

顶: 0 踩: 0 回复

78楼

破折君博客

在zac的书上看过这篇类似的文章，感觉像伪原创的。。。

评论来自电脑端时间:2012-09-02 13:07:53

顶: 0 踩: 0 回复

79楼

seo技术交流博客

怪不得现在有那么多的什么24小时内上百度前几名的服务哦、就是靠这个点击来的。这也是百度的一个漏洞啊。

评论来自电脑端时间:2012-09-02 12:41:51

顶: 0 踩: 0 回复

80楼

武汉seo

了解蜘蛛的爬取规律和百度的算法才能更好的seo啊，有地方seo换链交朋友的联系我哦

评论来自电脑端时间:2012-09-02 11:28:46

顶: 0 踩: 0 回复

81楼

龙三公子

目前才学SEO不得要领，那如何看蜘蛛有没有光临你的站呢？我用的是zblog。有哪位知道，先谢谢了！

评论来自电脑端时间:2012-09-02 11:10:22

顶: 0 踩: 0 回复

82楼

爱美丽吧

天天跟度娘打交道，现在看了这博文，让自己更有深入的了解和认知喇

评论来自电脑端时间:2012-09-02 10:37:05

顶: 0 踩: 0 回复

83楼

收腹机

写的很好，理论和实践都很强。

评论来自电脑端时间:2012-09-02 10:28:29

顶: 0 踩: 0 回复

84楼

视频营销

要重视用户体验，了解下搜索引擎的一些原理

评论来自电脑端时间:2012-09-02 09:51:06

顶: 0 踩: 0 回复

85楼

阿鹏

不如多关注UEO

评论来自电脑端时间:2012-09-02 09:40:46

顶: 0 踩: 0 回复

86楼

吴克难的博客

比喻的很贴切，做好该做的才会有意想不到的收获！

评论来自电脑端时间:2012-09-02 08:48:25

顶: 0 踩: 0 回复

87楼

励志文章网

多关注用户体验才是我们要做的

评论来自电脑端时间:2012-09-02 08:02:23

顶: 0 踩: 0 回复

88楼

我爱WordPress

学习了解了，对做网站很有帮助

评论来自电脑端时间:2012-09-02 07:50:16

顶: 0 踩: 0 回复

89楼

河南工程学院论坛

这个最实用，多谢分享

评论来自电脑端时间:2012-09-02 07:16:51

顶: 0 踩: 0 回复

90楼

一斑网

了解一点原理，做优化的时候就不会太盲目。

评论来自电脑端时间:2012-09-02 01:29:55

顶: 0 踩: 0 回复

91楼

泷泽萝拉

天天跟搜索引擎打交道。。。

评论来自电脑端时间:2012-09-02 01:14:25

顶: 0 踩: 0 回复

92楼

颜鹏

用户体验好了，百度自然会喜欢，在做好相关的seo才是不错的方法、

评论来自电脑端时间:2012-09-02 00:52:25

顶: 0 踩: 0 回复

93楼

刀刀毙命

搜索引擎的工作原理这个问题还是问李彦宏吧据说他有专利呢

评论来自电脑端时间:2012-09-02 00:02:59

顶: 0 踩: 0 回复

94楼

上海婚纱摄影

松松老师怎么看待百度8月25日的更新，我的网站szkphoto被将名次后至今仍没恢复，到底要怎样呢，真是愁死我了！！！

评论来自电脑端时间:2012-09-01 23:39:32

顶: 0 踩: 0 回复

95楼

博客赚钱

看起来比较复杂。。但还是了解了。。

评论来自电脑端时间:2012-09-01 23:37:23

顶: 0 踩: 0 回复

96楼

淘作文

很实用的一篇文章，感谢松哥的分享。

评论来自电脑端时间:2012-09-01 23:13:10

顶: 0 踩: 0 回复

97楼

老鹰主机优惠码

从目前来看越来越没有规则可言了 ,不知以后会怎样。

评论来自电脑端时间:2012-09-01 22:57:37

顶: 0 踩: 0 回复

98楼

木马随风转

学习了

评论来自电脑端时间:2012-09-01 22:21:09

顶: 0 踩: 0 回复

99楼

1314

蜘蛛总是来的主页叫我很郁闷不收录内容页

评论来自电脑端时间:2012-09-01 21:59:58

顶: 0 踩: 0 回复

100楼

大发

很难跟上搜索引擎的脚步啊

评论来自电脑端时间:2012-09-01 21:41:22

顶: 0 踩: 0 回复

‹‹ 1 2 › ››

卢松松博客

搜索引擎工作的基础流程与原理

| 阅读量 | 分类: SEO推广 | 作者: 读者投稿 | 时间：2012年09月01日 10:17

一.网页搜集。

二.预处理。

三、查询服务。

四、现今百度的流程漏洞。

五、搜索引擎大体流程图(加上用户行为分析器)

最后我想说

发表感想加入微信群

document.write('<a href="https://console.songsongyun.com/login/?back_url='+encodeURI(window.location.href)+'" target="_blank"><i class="fa fa-sign-in"></i> 点此登录松松云平台免费<i class="fa fa-address-card-o"></i>认证</a>');

阳光房

指纹密码锁

四物汤标准配方

epson维修

宜鑫宜益

知名兽药厂家

知名兽药厂家

彭某某

彭某某

tomhua学堂

癌症康复免费咨询中心

防辐射孕妇装

内涵图

worry

worry

乐事网

郑州悦美整形

没印象

郝剑波博客

木木工作室

博客优化

免费资源

陈松松视频营销

第三代搜索

开心不易

T.n.T

门业人才网

单纯的码农

德尚U盘礼品

职业装

星光博客

水源热泵的特点

南京东大医院

洋子博客

广州妇科医院

贴片晶振

武汉seo博客

李鸣

睡眠健康网www.52sleep.net

志新化工商务网

默涵

大荣

seo博客

低价建站

脚气好啦

tomwilson

请叫我韵

淘开心

易亦义

叉车

吴克难的博客

觉梦博客

旅途者

超级医生

广州金蝶软件销售服务中心

官橙宝

好运鞋网

长沙SEO

哈伦裤

石家庄旅游景点大全

潮乐购

喜鱼网

85女性网

广州离婚律师

吧嗒咚咚

吧嗒咚咚

蓝颜

闵非凡博客

买衣服网