-
Google Analytics与百度统计的统计数据都是有差异的,而且差异非常大,其根本原因在于数据统计的原理和机制是不同的。下面分享一下两位博友李鑫和赵高欣对Google Analytics与百度统计做出的原理分析。
百度统计的工作原理分析
百度统计提供的JS,实质上是往页面中引入hm.baidu.com/h.js的这段代码,该代码的内容会根据后面的参数有所不同,h.js?后面的参数就是你在百度统计里的id。
获取该h.js代码的同时,百度统计会往你的浏览器写入一个名字为“HMACCOUNT”的cookie,该cookie的过期时间为2038年,所以只要你没有清空浏览器cookie,基本就永不过期。
h.js被下载后,便执行其脚本获取一些浏览器相关信息和访问来源,获取的信息包括屏幕尺寸、颜色深度、flash版本、用户语言等。
从js代码中可以得到,所有参数包括这些:”cc,cf,ci,ck,cl,cm,cp,cw,ds,ep,et,fl,ja,ln,lo,lt,nv,rnd,sb,se,si,st,su,sw,sse,v”。这些参数的意义大致如下:
cc: 不知道,一般为1
cf:url参数hmsr的值
ci:url参数hmci的值
ck:是否支持cookie 1:0
cl:颜色深度 如 “32-bit”
cm:url参数hmmd的值
cp:url参数hmpl的值
cw:url参数hmkw的值
ds:屏幕尺寸,如 ’1024×768′
ep:初始值为’0′,时间变量,反映页面停留时间,格式大概是:现在时间-载入时间+“,”+另一个很小的时间值
et:初始值为’0′,如果ep时间变量不是0的话,它会变成其他
fl:flash版本
ja:java支持 1:0
ln:语言 zh-cn
lo: 不知道,一般为0
lt:日期 time.time(),如“1327847756”,在首次请求没有
nv: 不知道,一般为1或者0
rnd:十位随机数字
sb:如果是360se浏览器该值等于‘17’
se: 和搜索引擎相关
si:统计代码id
st:
su:上一页document.referrer
sw: 不知道,估计和搜索引擎有关,一般为空
sse:不知道,估计和搜索引擎有关,一般为空
v:统计代码的版本 ,目前该值为“1.0.17”
当这些参数都设置完毕了(有些参数并没有赋值),筛选出已经赋值了的参数,并作为hm.baidu.com/hm.gif的参数拼凑出一个url,如:http://hm.baidu.com/hm.gif?cc=1&ck=1&cl=32-bit&ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn 。然后请求该图片。
百度统计服务端,通过接收到这个请求,并从这个图片的网址附带的参数获取相关信息,记录访客访问记录;当页面被用户关闭的时候,同样会触发一次请求hm.gif的过程,但这个过程不是所有浏览器和所有关闭动作都支持。
使用使用Wireshark(一款网络抓包工具)测试可以发现,浏览器总共向服务器端发送了4次请求:
请求一段js脚本。
加载完毕时候出发一次请求,并传递参数
退出页面时候,发出一次请求,并传递参数,与上面对比,发现ep参数有变化。
百度统计是基于cookie的,当请求js脚本的时候,会在你电脑里保存一个永久cookie,该cookie作为你的用户标识。同时发现,但退出时候参 数ep从最开始的0变为了“7289%2C115”,转义后是“7289,115”这是两个毫秒单位,即7.2秒和0.1秒的意思。同时前两次请求 hm.gif的时候lt参数(时间,javascript:(new Date).getTime())是不变的。rnd随机数每次都变。
Google Analytics的工作原理
当用户访问了一个包含Google Analytics统计代码的页面,这段代码会被用户的浏览器执行,而这段代码的作用就是用来收集这位访客的信息,比如浏览页面的URL、浏览器类型、操作系统、系统语言、屏幕分辨率等。
GA统计代码随后将这些访客信息存储到Cookie中,Cookie是一段短小的文本,存放于本地,与访问的网站相关联,它被用来判断一个用户是初次访问还是多次访问,页面的推荐来源和随后的页面浏览信息等。
最后,所有的被收集到的信息会被发送到Google Analytics的数据服务器上。这个过程比较巧妙,我们知道服务器的日志文件会记录每一次的文件请求信息,而Google Analytics收集数据的方式便是通过向服务器请求一个透明的1×1的GIF图片文件,这个文件请求以及请求时间会在服务器日志中被记录,而文件请求 信息包含了GA统计代码收集的数据和Cookie信息,这样,每当这个GIF图片收到请求申请时,访客的访问信息就会被Google Analytics数据服务器收集。
不过Google Analytics只是发送一张gif请求,很多时候会发送多张gif请求。假如有一个gif图片无法统计,那么GA会发送其他gif请求,
总结:
网站分析大师Avinash曾经说过只要有数据有90%的准确度,那么就可以及时采取行动了。重要的是能够看出趋势,进而采取行动,然后进行测试,不断地优化。
顶: 3 踩: 8来源:卢松松博客 QQ/微信:13340454
Google Analytics与百度统计原理
| 阅读量 | 分类: 免费资源 | 作者: 卢松松
相关文章阅读更多:建站工具 数据分析 百度统计
- 2022-04-09 网站统计工具付费时代来临
- 2022-01-22 友盟(CNZZ)停止海外域名的统计服务
- 2021-11-21 程序员角度对百度推广OCPC的分析
- 2019-08-30 百度统计正式上线白名单过滤功能
- 2019-08-26 网站百度统计后台出现大量不明来源违禁词
- 2019-06-30 百度统计分析云平台上线
- 2017-03-19 百度统计出微信版,运营数据随手可查
- 2016-10-27 如何通过百度统计来做页面内容调整?忒干,请自备水杯
- 2016-01-27 2015年流量入口选择数据,来自百度统计研究院
- 2015-12-19 百度统计升级网页实时推送至搜索引擎功能
- 2015-07-17 【数据分析】为何流量与关键词的数据比百度统计少
- 2014-06-30 百度统计上线“专题推送”功能
- 2013-07-24 百度统计代码被黑 部分网站出现弹出广告
- 2013-03-07 百度统计已支持百度转码流量
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
发表感想加入微信群
史上最全的19种软文标题写作套路
如何批量修改word文档名称
十种常见的营销策略
夫唯学院seo视频教程
站长的问题在这可以得到答案
防辐射孕妇装
香香
军哥
阿亚
流星侠客网
李琦
EDM营销
秦远征博客
吉安
爱思优
长安婚纱摄影
taobao.jp
SG门户
人民币收藏
人民币收藏
林杨博客
小李飞刀SEO
影迷网
武林外乱
人才
80博客
吧嗒咚咚
吧嗒咚咚
tech迷
北京翻译公司
吴克难的博客
深圳易拉宝
励志文章网
html6game
丰胸产品排行榜
三格网
上海婚纱摄影工作室
橱柜
负压风机
由 卢松松 于 2012-10-11 20:56:49 最后编辑
价值人生
田润林博客
我的心机
个人网站
茅屋网
我秀我网
batteries
微微名网
SEO优化
SEO
单人操作分析仪
纸尿裤
阿光博客
长春
男装
陈念
流量计
枕头网
优极网
godaddy优惠码
wifi共享精灵
美丽说蘑菇街
停车场系统
性爱巴士
精品女装
吴克难的博客
蘑菇成长网
中国鞋网
郑州SEO
幸凡
幸福快乐网
吴小茹
礼品
第一站博客
由 卢松松 于 2012-10-11 17:05:15 最后编辑
先看看
松亮博客
江门就医网
有趣的网站
数字制造网
龙三公子
活在当下的互联网
欢迎访问我的博客,近期也打算整理出一些文章出来。
E路顺博客
好运鞋网
天涯网赚
旅途者
后箱盖
乐活时代购物
上海整形医院
然推网
企业文化
外贸seo
鹿胎膏
srdesign.cn
仿牌主机
小宇博客
不能吧
seo博客
男人享用一生的法宝
好玩
炼油助剂
泷泽萝拉第三部