-
robots.txt是一种存放于网站根目录下的文本文件,用于告诉搜索引擎的爬虫(spider),此网站中的哪些内容是不应被搜索引擎的索引,哪些是可以被索引。通常认为,robots.txt文件用来搜索引擎对目标网页的抓取。
robots.txt协议并不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个文件,但也有一些特殊情况。
对于Google来说,使用robots也未必能阻止Google将网址编入索引,如果有其他网站链接到该网页的话,Google依然有可能会对其进行索引。按照Google的说法,要想彻底阻止网页的内容在Google网页索引中(即使有其他网站链接到该网页)出现,需要使用noindex元标记或x-robots-tag。例如将下面的一行加入到网页的header部分。
<meta name="googlebot" content="noindex">
如果Google看到某一页上有noindex的元标记,就会将此页从Google的搜索结果中完全丢弃,而不管是否还有其他页链接到此页。
对于百度来说,情况和Google类似,如果有其他网站链接目标网页,也有可能会被百度收录,从百度的说明页面上看,百度并不支持像Google那样通过noindex完全将网页从索引上删除,只支持使用noarchive元标记来禁止百度显示网页快照。具体的语句如下。
<meta name="Baiduspider" content="noarchive">
上面这个标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。
本文来源:月光博客
顶: 0 踩: 0来源:卢松松博客 QQ/微信:13340454
搜索引擎的Robots规则
| 阅读量 | 分类: 好文分享 | 作者: 转载大师
相关文章阅读更多:搜索引擎
- 2024-09-21 现代SEO:让搜索引擎抓取一半的内容
- 2024-08-29 搜索引擎广告:它是什么以及如何工作
- 2023-05-15 百度搜索流量下降至39.64%,Bing和Yandex上升
- 2022-11-06 如何找到网上最好的资源?
- 2022-11-04 微信搜索上线竞价广告
- 2022-10-06 被忽视的微信搜一搜巨大流量
- 2022-07-15 百度还是企业做流量首选渠道吗?
- 2022-04-19 新网站怎么让百度快一点收录
- 2022-04-01 2022年3月搜索引擎市场份额排行榜
- 2022-04-01 百度搜索流量还值得做吗
- 2022-03-15 剖析SEO流量问题
- 2022-01-24 字节跳动vs百度vs腾讯,谁才是最后的搜索王者?
- 2022-01-11 微信搜一搜月活已超过百度App
- 2021-10-22 传腾讯和字节跳动内容有望向搜索引擎开放
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
发表感想加入微信群
软件
淘金阁
囧事
给老人买什么礼物好
伊顿ups电源
专注基础优化
持之以恒
21氪
小学科学论文
一直学习中
564b博客
国人SEO
广州金蝶软件销售服务中心
秦晚词
第一站网站建设论坛
泷泽萝拉
博客赚钱
SOYOU
西狂博客
真空包装机
淘宝客博客
邢台seo
闵非凡博客
穷鬼网赚博客
jiji
Android开发
合肥SEO
完美之窗
嘉兴seo
爱上钓鱼网
励志文章读后感
外星人的博客
第一站网站建设论坛
拉力试验机