百度新版Baiduspider移动ua升级

 人参与 | 时间:2015年05月21日 12:30

百度发布公告:Baiduspider针对移动抓取user agent(以下简称ua)进行了升级,与PC端的抓取ua做到版本统一,均称为Baiduspider/2.0。移动ua和pc ua详情如下:

新版移动ua:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;)

AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3

(compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

PC ua:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

如果robots封禁agent是Baiduspider,会对PC和移动同时生效。

有些代码适配站点(同一个url,PC ua打开的时候是PC页,移动ua打开的时候是移动页),通过设置robots的agent封禁达到只让移动Baiduspider抓取的目的,但由于 PC和移动Baiduspider的agent都是Baiduspider,所以这种方法不可取。

之前通过“+http://www.baidu.com/search/spider.html”进行识别的网站需要修改识别方式,新的正确的识别Baiduspider移动ua的方法有:

1. 通过关键词“Android”或者“Mobile”来进行识别,判断为移动访问或者抓取。

2. 通过关键词“Baiduspider/2.0”,判断为百度爬虫。

相关阅读:

百度官方:spider抓取过程中的策略

百度:巧用robots避免蜘蛛黑洞

百度:搜索引擎抓取系统概述

百度确认:蜘蛛会抓取纯文本链接的URL

顶: 1踩: 0

来源:,欢迎分享,(QQ/微信:13340454)