搜索引擎的Robots规则

| 阅读量 | 分类: 好文分享 | 作者: 转载大师 | 时间：2012年09月01日 10:45

robots.txt是一种存放于网站根目录下的文本文件，用于告诉搜索引擎的爬虫(spider)，此网站中的哪些内容是不应被搜索引擎的索引，哪些是可以被索引。通常认为，robots.txt文件用来搜索引擎对目标网页的抓取。

robots.txt协议并不是一个规范，而只是约定俗成的，通常搜索引擎会识别这个文件，但也有一些特殊情况。

对于Google来说，使用robots也未必能阻止Google将网址编入索引，如果有其他网站链接到该网页的话，Google依然有可能会对其进行索引。按照Google的说法，要想彻底阻止网页的内容在Google网页索引中(即使有其他网站链接到该网页)出现，需要使用noindex元标记或x-robots-tag。例如将下面的一行加入到网页的header部分。

<meta name="googlebot" content="noindex">

如果Google看到某一页上有noindex的元标记，就会将此页从Google的搜索结果中完全丢弃，而不管是否还有其他页链接到此页。

对于百度来说，情况和Google类似，如果有其他网站链接目标网页，也有可能会被百度收录，从百度的说明页面上看，百度并不支持像Google那样通过noindex完全将网页从索引上删除，只支持使用noarchive元标记来禁止百度显示网页快照。具体的语句如下。

<meta name="Baiduspider" content="noarchive">

上面这个标记只是禁止百度显示该网页的快照，百度会继续为网页建索引，并在搜索结果中显示网页摘要。

本文来源：月光博客

顶: 0 踩: 0

来源：卢松松博客 QQ/微信：13340454 ，转载请注明出处！

本文地址：https://lusongsong.com/info/post/236.html

发表感想加入微信群

热门跟帖

最新跟帖

1楼

软件

你这个形容真贴切

评论来自电脑端时间:2018-02-04 16:15:41

顶: 0 踩: 0 回复

2楼

淘金阁

搜狗的是gou娘，他当然不干了。哈哈

评论来自电脑端时间:2014-01-16 16:35:28

顶: 0 踩: 0 回复

呵呵，你这个形容真贴切

跟帖来自电脑端时间:2013-12-22 09:47:14

顶: 0 踩: 0 回复

4楼

囧事

不明觉厉

评论来自电脑端时间:2013-12-19 11:57:52

顶: 0 踩: 0 回复

5楼

给老人买什么礼物好

笑尿。

评论来自电脑端时间:2013-05-01 20:59:00

顶: 0 踩: 0 回复

6楼

伊顿ups电源

呵呵第一次听到这个说法

评论来自电脑端时间:2012-06-29 13:39:10

顶: 0 踩: 0 回复

7楼

专注基础优化

基础优化很重要，robots也很重要，属于基础优化的范畴的。

评论来自电脑端时间:2015-11-22 22:49:52

顶: 0 踩: 0 回复

8楼

持之以恒

还在研究中……

评论来自电脑端时间:2015-03-01 10:27:26

顶: 0 踩: 0 回复

9楼

21氪

robotstxt文件一定需要吗

评论来自电脑端时间:2013-06-09 17:04:50

顶: 0 踩: 0 回复

10楼

小学科学论文

robotstxt协议也算是门学问
一直学习中

评论来自电脑端时间:2013-02-06 18:56:18

顶: 0 踩: 0 回复

11楼卢松松

抱歉哈，已经修正了

跟帖来自电脑端时间:2012-09-01 17:02:10

顶: 0 踩: 0 回复

12楼杨飞博客

没有不行的，放个空的也行

跟帖来自电脑端时间:2012-09-01 13:00:20

顶: 0 踩: 0 回复

13楼

564b博客

欢迎google收录。

评论来自电脑端时间:2012-11-16 18:05:13

顶: 0 踩: 0 回复

14楼

国人SEO

对于企业站和博客及小型网站来说，这个没有太大的区别

评论来自电脑端时间:2012-11-16 09:12:49

顶: 0 踩: 0 回复

15楼

广州金蝶软件销售服务中心

这样比较的话好像Google 更胜一筹咧

评论来自电脑端时间:2012-09-02 22:51:59

顶: 0 踩: 0 回复

16楼

秦晚词

一般都做这个文件，但具体哪一内页还真没做过。

评论来自电脑端时间:2012-09-02 13:10:34

顶: 0 踩: 0 回复

17楼

第一站网站建设论坛

放置robots 会给搜索引擎提供方便。

评论来自电脑端时间:2012-09-02 06:29:33

顶: 0 踩: 0 回复

18楼

泷泽萝拉

正常都会放这个文件的。。

评论来自电脑端时间:2012-09-02 01:18:24

顶: 0 踩: 0 回复

19楼

博客赚钱

嗯。。学习了

评论来自电脑端时间:2012-09-02 00:39:40

顶: 0 踩: 0 回复

20楼

SOYOU

网站没有这些东西，没事吧

评论来自电脑端时间:2012-09-01 22:53:03

顶: 0 踩: 0 回复

21楼

西狂博客

支持月光和卢松松

评论来自电脑端时间:2012-09-01 21:53:07

顶: 0 踩: 0 回复

22楼

真空包装机

原来只是禁止百度显示该网页的快照，百度会继续为网页建索引，并在搜索结果中显示网页摘要。

评论来自电脑端时间:2012-09-01 21:35:30

顶: 0 踩: 0 回复

23楼

淘宝客博客

我想我不会把我的后台地址和后台页面连接到其他的网站吧。

评论来自电脑端时间:2012-09-01 20:40:16

顶: 0 踩: 0 回复

24楼

邢台seo

我有很多站也没有robots 看的收录也可以的。

评论来自电脑端时间:2012-09-01 20:39:40

顶: 0 踩: 0 回复

25楼

闵非凡博客

原来如此，又学一招，呵呵。

评论来自电脑端时间:2012-09-01 17:39:46

顶: 0 踩: 0 回复

26楼

穷鬼网赚博客

合理运用这个文件对网站还是有好处的。

评论来自电脑端时间:2012-09-01 17:26:16

顶: 0 踩: 0 回复

27楼

jiji

好牛哈。。

评论来自电脑端时间:2012-09-01 17:06:38

顶: 0 踩: 0 回复

28楼

Android开发

月光的文章啊，那个“下面的一行”和“具体的语句如下”都没有下文啊，松松忘了加了吧

评论来自电脑端时间:2012-09-01 15:35:44

顶: 0 踩: 0 回复

29楼

合肥SEO

我还一直以为设置了robots就彻底解决问题了……

评论来自电脑端时间:2012-09-01 15:09:59

顶: 0 踩: 0 回复

30楼

完美之窗

这好在研究这个哈，哈哈

评论来自电脑端时间:2012-09-01 14:47:50

顶: 0 踩: 0 回复

31楼

嘉兴seo

个人感觉百度于robots还未完善吧

评论来自电脑端时间:2012-09-01 13:15:49

顶: 0 踩: 0 回复

32楼

爱上钓鱼网

设应该是搜索引擎行业的规范吧，站长必须学习！

评论来自电脑端时间:2012-09-01 12:05:44

顶: 0 踩: 0 回复

33楼

励志文章读后感

学习一下

评论来自电脑端时间:2012-09-01 11:52:02

顶: 0 踩: 0 回复

34楼

外星人的博客

我的站没有robots文件

评论来自电脑端时间:2012-09-01 11:48:38

顶: 0 踩: 0 回复

35楼

第一站网站建设论坛

传说中的板凳呀，学习了。

评论来自电脑端时间:2012-09-01 11:15:48

顶: 0 踩: 0 回复

36楼

拉力试验机

倒数第二段提到的语句看不到的呢?

评论来自电脑端时间:2012-09-01 10:58:20

顶: 0 踩: 0 回复

相关文章阅读更多：搜索引擎

2025-06-10 当年说谷歌完了的人，现在都沉默了
2025-04-24 百度已经是中国最多排第四的搜索引擎吗
2025-04-19 SEO标题与描述的合规性写法
2025-04-17 浅谈底层seo的现状
2025-04-14 区域域名后缀是否影响SEO排名？我的分析与看法
2025-02-14 怎么才能做好一个符合SEO优化网站第一步工作
2024-09-21 现代SEO：让搜索引擎抓取一半的内容
2024-08-29 搜索引擎广告：它是什么以及如何工作
2023-05-15 百度搜索流量下降至39.64%，Bing和Yandex上升
2022-11-06 如何找到网上最好的资源？
2022-11-04 微信搜索上线竞价广告
2022-10-06 被忽视的微信搜一搜巨大流量
2022-07-15 百度还是企业做流量首选渠道吗？
2022-04-19 新网站怎么让百度快一点收录
2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦！