-
1、什么是抓取异常
对于互联网中可正常访问的页面,百度蜘蛛抓取的内容应与普通用户访问到的内容是一致的,除此以外的情况,就是抓取异常。
2、抓取异常对网站的影响有哪些
若网站中有大量抓取异常的网页存在,搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,最终影响到网站在百度搜索引擎中的表现。
3、什么是死链
页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式。
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
对于死链,建议及时修复死链数据,或进行死链数据推送,以便搜索引擎更快地发现死链,减少死链对用户以及搜索引擎的影响。
4、什么是IP禁封
限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,即为IP禁封。
5、什么是UA禁封
UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA禁封。
6、什么是异常重定向
将网络请求重新指向其他位置即为重定向。常见的重定向有两种:永久重定向(301跳转协议)和暂时重定向(302跳转协议),目前百度都可以识别和支持。
对于长时间跳转到其他域名的情况,如网站更换域名,建议您使用301跳转协议。
7、还有哪些其他异常
针对百度refer的作弊:网页针对来自百度的refer返回不同于正常内容的行为。
针对百度ua的作弊:网页对百度UA返回不同于页面原内容的行为。
JS跳转作弊:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
压力过大引起的偶然禁封:百度会根据站点的规模,访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是 “Service Unavailable”),百度蜘蛛会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。
原文地址:http://zhanzhang.baidu.com/wiki/32
顶: 0 踩: 0来源:卢松松博客 QQ/微信:13340454
百度官方:百度抓取异常问答
| 阅读量 | 分类: 好文分享 | 作者: 转载大师
相关文章阅读更多:百度 SEO
- 2023-09-28 聊聊做抖音SEO里的四派,你了解多少?
- 2023-09-26 “李佳琦”正在成为公众号爆文
- 2023-09-24 如何在抖音上搞到TOB客户流量?
- 2023-09-12 快速找到对标账号的方法
- 2023-09-10 百度站长后台大量删除低质站点,还有必要做网站SEO吗?
- 2023-09-06 被百度判定为低质量网站了!如何整改?
- 2023-08-17 SEO是人人都可以挖的金矿,SEO终极算法第四部!
- 2023-08-12 网传某黑帽SEO培训大V出事了
- 2023-07-15 微博引流你不知道的10条实战小经验分享
- 2023-07-09 文心一言AI对话上线百度搜索内测,提前布局SEO精准流量
- 2023-06-27 微信问一问是什么、怎么入驻、SEO引流怎么玩
- 2023-06-16 SEO养日收网站的一些经验分享(非时效性文章)
- 2023-06-15 Google SEO怎么做?谷歌seo优化包含哪些内容?
- 2023-06-04 百度开始批量打击SEO(AI采集)大型网站
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
发表感想加入微信群
趣知识
吐槽大会段子
高清图片
好事多博客
回转支承
3d木马无线传输系统
囧
数控深孔钻
手链编法
红颜婚恋网
木质手链
监控公司
了解了 支持
泷泽萝拉第三部
马尔代夫旅游报价
西狂博客
分文博客
技术宅
设计2点半
淘作文