-
百度站长平台刚刚发布了一个小技巧:巧用robots避免蜘蛛黑洞。
比如很多网站都有筛选功能,通过筛选功能产生的网页经常会被搜索引擎大量抓取,而这其中很大一部分检索价值不高。
如“500-1000之间价格的租房”,首先网站(包括现实中)上基本没有相关资源,其次站内用户和搜索引擎用户都没有这种检索习惯。
这种网页被搜索引擎大量抓取,只能是占用网站宝贵的抓取配额。
那么该如何避免这种情况呢?
我们以北京某团购网站为例,看看该网站是如何利用robots巧妙避免这种蜘蛛黑洞的:
对于普通的筛选结果页,该网站选择使用静态链接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun
同样是条件筛选结果页,当用户选择不同排序条件后,会生成带有不同参数的动态链接,而且即使是同一种排序条件(如:都是按销量降序排列),生成的参数也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c
对于该团购网来说,只让搜索引擎抓取筛选结果页就可以了,而各种带参数的结果排序页面则通过robots规则拒绝提供给搜索引擎。
robots.txt的文件用法中有这样一条规则:Disallow: /*?* ,即禁止搜索引擎访问网站中所有的动态页面。该网站恰是通过这种方式,对Baiduspider优先展示高质量页面、屏蔽了低质量页面,为Baiduspider提供了更友好的网站结构,避免了黑洞的形成。
顶: 0 踩: 0扩展阅读:蜘蛛黑洞特指网站通过极低的成本制造出大量参数过多,及内容雷同但具体参数不同的动态URL ,就像一个无限循环的“黑洞”将spider困住,Baiduspider浪费了大量资源抓取的却是无效网页。
来源:卢松松博客 QQ/微信:13340454
百度:巧用robots避免蜘蛛黑洞
| 阅读量 | 分类: 微新闻 | 作者: 卢松松
相关文章阅读更多:SEO新闻 百度
- 2026-01-23 百度文心月活破2亿后:一个新的互联网入口,正在成型
- 2025-12-13 百度真下场做GEO了吗?一张报价表,撕开了AI圈的边界
- 2025-11-15 阿里和百度突然改名:AI不炫技,开始抢用户了!
- 2025-11-14 百度突然大转向:抛弃万亿参数,不再炫技
- 2025-08-29 百度云智大会上的“AI厨房”,能炒出什么菜?
- 2025-07-04 年赚3亿的百度总代倒下,但老板的别墅和园区还在
- 2025-06-10 当年说谷歌完了的人,现在都沉默了
- 2025-04-24 百度已经是中国最多排第四的搜索引擎吗
- 2025-04-21 为什么百度搜索、微信搜索要接入AI大模型DeepSeek?对谁更有好处
- 2025-03-26 中国AI四强争霸:DeepSeek升级,阿里腾讯百度如何接招?
- 2025-03-22 倒查半年,百度副总谢广军没事了
- 2025-03-17 那个自我革新的百度,带着文心4.5和X1回来了
- 2025-02-14 免费了、开源了!看看百度能不能打个翻身仗
- 2025-02-12 苹果放弃百度,和阿里合作AI了
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!







发表感想加入微信群
山姆娱乐
MBA中国网
东盟购
v587
ringinter
威友丝网制品
跑步机什么牌子好
你可以在我网站底部找到链接,或者搜索 欲思博客 。
手机游戏排行榜
计算机编程
老刘笔记
洛阳阀门
唯美图
90日记
他她服装搭配网
吴涛
wingsBlog
提升机
北京电线电缆
石头
企业管理软件
【红博客】-关注中小企业及创业
找折购
大学生的生意经
投资移民
2014天猫双十一购物清单
响应网酒店预订
人生那点事
鸡公煲论坛
飞微网
苏州网站建设
学生创业
明星图片
域名抢注
那么问题来了
广西旅行社
稳定虚拟主机推荐
ajian
极品飞鸽