卢松松博客

搜索引擎是怎么删除重复网页的

 人参与 | 时间:2012年09月28日 09:36

百度曾在站长贴吧里做过这样一个回复:从用户体验角度,“有些转载未必比原创差”。比方一篇科技原创博文,被知名门户网站的科技频道转载。如果这种转载保留原创者姓名和出处链接,实际上对原创者是有利的,因为起到了更好的传播效果。只是国内的转载,很多是掐头去尾,使原创者比较受伤。

据资料表明近似重复网页的数量占网页总数的的比较高达全部页面的29%,而完全相同的页面大约占全部页面的22%。很多站长都会抱怨,自己写的文章被转载后要么排名消失、要么转载站排在前面,比如下图:

搜索引擎是怎么删除重复网页的 SEO推广 第1张

在解决这个问题之前,我认为有必要了解下搜索引擎的“去重算法框架”,换个角度看看搜索引擎是怎么给网页去重的。

你的网页什么时候会被删除?

因为互联网上有大约22%的内容是相同的,一旦你的文章发表在网上,就有可能会被转载,而一般判断帮你的网页为转载,那么搜索引擎一般会从三个时间段来删除你的网页:

(1)抓取页面的时候删除,这样可以减少搜索引擎带宽以及减少存储数量;

(2)收录之后删除重复网页;

(3)用户检索时候进行再次删除;增加准确性,耗费时间;

内容重复的4种类型:

1.如果2篇文章内容和格式上毫无差别,则这种重复叫做“完全重复页面”

2.如果2篇文章内容相同,但是格式不同,则叫做“内容重复页面”

3.如果2篇文章有部分重要的内容相同,并且格式相同,则称为“布局重复页面”

4.如果2篇文章有部分重要的内容相同,但是格式不同,则称为“部分重复页面”

删除重复网页对于搜索引擎有很多好处:

1.如果这些重复网页并从搜索引擎数据库中去掉,就能节省一部分存储空间,提高检索的质量。

2.为了提高网页的搜集速度,搜索引擎会对以往搜集信息的分析,预先发现重复网页,在今后的网页搜集过程中就可以避开这些网页,这就是为什么总转载的网站排名不高的原因了。

3.对某个镜像度较高的网页,搜索引擎会赋予它较高的优先级,当用户搜索时就会赋予它较高的权重。

4. 近似镜像网页的及时发现有利于改善搜索引擎系统的服务质量,也就是说如果用户点击了一个死链接,那么可以将用户引导到一个相同页面,这样可以有效的增加用户的检索体验。

通用去重算法框架

对于网页去重任务,具体可以采取的技术手段五花八门,各有创新和特色,但是如果仔细研究,其实大致都差不多。

搜索引擎是怎么删除重复网页的 SEO推广 第2张

上图给出了通用算法框架的流程图,对于给定的文档,首先要通过一定特抽取手段,从文档中抽取出一系列能够表征文档主题内容的特征集合。这一步骤往往有其内在要求,即尽可能保留文档重要信息,删除无关信息。之所以要删除部分信息,主要是从计算速度的角度考虑,一般来说,删除的信息越多,计算速度会越快。

这就是为什么你想做的关键字总没有排名,反而不想做的关键词却能排名靠前的原因之一,搜索引擎把它认为不重要的词语删除了。

相关阅读:

百度搜索研发部:浅谈互联网页面价值

搜索引擎工作的基础流程与原理

用户搜索行为及其意图浅析

百度解构第一季 - 理解用户搜索行为

顶: 0踩: 0

来源:,欢迎分享,(QQ/微信:13340454)

必填

选填

选填

◎已有 171 人评论,微信:QQ13340454

1楼找纸网  2015-10-21 11:42:27
不是每个人都会是个头脑风暴的。!
顶: 0踩: 0 回复
2楼中国美女最多的大学排行  2014-12-11 23:15:11
大量完全重复文章的飘过,就头条是原创的。。。
顶: 0踩: 0 回复
3楼防辐射孕妇装  2014-11-26 23:23:13
提高搜索引擎的工作效率才是硬道理,我们站长朋友都应该付出一份力量。
顶: 0踩: 0 回复
4楼光影星博客  2014-11-04 14:00:10
还是坚持原创好,伪原创已经撑不下去了!
顶: 0踩: 0 回复
5楼郑州衡鑫电子衡器有限公司  2014-03-04 13:55:43
原来改段落早就不行了
顶: 0踩: 0 回复
6楼内涵图  2014-01-03 12:57:35
祝节日快乐啊,松哥。抢沙发,只有时时关注卢松松博客的人才能抢到沙发[REVERT=梦寒博客于2012-9-2823:37:09回复]又被你抢去了,沙发的位置又没得做了啊啊啊啊啊啊[/REVERT]
顶: 0踩: 0 回复
7楼精密管  2013-01-10 13:50:54
原来如此啊
顶: 0踩: 0 回复
8楼美食家  2012-11-22 17:07:22
学习了,多谢你的好文章
顶: 0踩: 0 回复
9楼我爱喵呜  2012-11-04 18:23:04
原创才是硬道理呀
顶: 0踩: 0 回复
10楼秦远征博客  2012-10-29 16:32:22
受教了。互联网上有大约22%的内容是完全相同的, 这个比例很高啊。
顶: 0踩: 0 回复
11楼爱思优  2012-10-23 10:16:05
又被人K了,跟重复有关吗
顶: 0踩: 0 回复
12楼邯郸治疗白癜风  2012-10-22 09:03:15
亲爱的楼主,后面有点没看懂。
顶: 0踩: 0 回复
13楼武汉seo  2012-10-19 08:53:35
去重算法框架,确实需要好好了解下。
顶: 0踩: 0 回复
14楼草根5待  2012-10-14 10:45:21
小站 新站不适合 做原创 除非PR大于4.
顶: 0踩: 0 回复
15楼石家庄seo  2012-10-14 10:23:32
关注哈久了
顶: 0踩: 0 回复
16楼人才  2012-10-13 13:43:50
我来给松哥洒香水
顶: 0踩: 0 回复
17楼wifi共享精灵  2012-10-12 16:24:23
看来我得好好改改我的发文习惯了!!!
顶: 0踩: 0 回复
18楼大艺术家Jolin新专辑大卖  2012-10-11 16:49:49
内容还是保持原创,提供给用户需要的信息,才是最主要的
顶: 0踩: 0 回复
19楼执子之手  2012-10-09 16:17:35
小网站的文章被大网站转去了,还掐头去尾,小网站哪里来排名和流量~大家转载我的文章一定要加上我的网站链接哦~嘎嘎
由 卢松松 于 2012-10-11 17:07:54 最后编辑
顶: 0踩: 0 回复
20楼搜客网  2012-10-09 15:49:10
我十分同意转载的未必就不如原创的,转载带上原作者的来源和链接是必须的,是一个对作者起码的尊重。但往往有时候,有些网站的文章虽然是原创,但原网站的色彩以及布局都非常难看,如果这个时候我有一个布局合理,色彩搭配美观的网站转载了这些文章,不相当于给既给原文章推广,还可以让用户体验提升呢?
顶: 0踩: 0 回复
21楼天津搬家公司  2012-10-09 14:45:50
呵呵这个感觉也是挺好的嘞
顶: 0踩: 0 回复
22楼诸葛诺博客  2012-10-09 12:36:36
其实对比一下谷歌 就差很多嘛 这个百度算法几十年都还没多少变化 每次催得像什么 o(︶︿︶)o 唉……
顶: 0踩: 0 回复
23楼华子SEO博客  2012-10-09 10:11:01
火车头采集爽歪歪
顶: 0踩: 0 回复
24楼郝剑波博客  2012-10-06 16:35:57
我喜欢这篇文章,很好
顶: 0踩: 0 回复
25楼川腾彩绘  2012-10-06 08:12:40
权重高的转载一样收录的,权重低了原创也不一定收录呢
顶: 0踩: 0 回复
26楼夜猫网赚  2012-10-02 20:39:59
不明白你写这文章的人,
顶: 0踩: 0 回复
27楼武汉seo  2012-10-02 18:52:11
有的标题被不同网站收录2次怎么解释呢
顶: 0踩: 0 回复
28楼沙滩上的紫贝壳  2012-10-01 22:08:18
嗯,百度总是让人很受伤。
顶: 0踩: 0 回复
29楼火车头采集爱好者  2012-10-01 20:19:31
采集是对百度技术的一种挑战,没有采集就如同放弃了先进的机器 回归远古时代,而这正是百度的技术的胜利,采集可以用来做推广,采集与蜘蛛是一类东西,本是同根生相煎何太急,
高难度采集推广=》qq:972130397
顶: 0踩: 0 回复
30楼吴克难的博客  2012-10-01 10:32:30
尽量原创,坚持更新才有出路!
顶: 0踩: 0 回复
31楼水长东  2012-10-01 10:24:34
这么智能。
顶: 0踩: 0 回复
32楼山寨吧  2012-10-01 09:59:16
今天国庆节 我来学习一次
顶: 0踩: 0 回复
33楼祈雨其雨  2012-10-01 08:54:31
高权重网站转载文章造成自己网站的页面收录消失的事情我也遇到过,好烦人
顶: 0踩: 0 回复
34楼名表排行榜  2012-10-01 07:26:49
博客很漂亮!!!
顶: 0踩: 0 回复
35楼番茄  2012-10-01 00:50:34
我的博客收录量还算可以,但百度还只释放了33个收录页面。
顶: 0踩: 0 回复
36楼上海代开发票  2012-10-01 00:18:42
松哥,节日快乐
顶: 0踩: 0 回复
37楼深圳网站建设  2012-09-30 23:53:04
请问lusongson:
我们网站是新的,文章在我们网站首发,但其它权重比我们高的网站采集我们网站内容,会影响我们网站内容收录吗?
顶: 0踩: 0 回复
38楼西安SEO  2012-09-30 23:40:38
你好松哥我最近网站的收录不是很好而且在下降,不知道师傅可以帮我诊断一下
顶: 0踩: 0 回复
39楼康莱斯  2012-09-30 22:05:05
像我们权重比较低的网站,转载过来,收录的可能性估计就很低了吧。
顶: 0踩: 0 回复
40楼马熙尧  2012-09-30 17:06:43
重复网页多了,也影响网站权重,本人基本原创,很少转载,被转载的情况没发现,呵呵
顶: 0踩: 0 回复
41楼茅屋网  2012-09-30 16:52:17
重复网页多了,也影响网站权重。。。。。所以,现在也尽量避免从网上大量转载。。。
顶: 0踩: 0 回复
42楼李涛  2012-09-30 16:37:26
适当转载挺好的
顶: 0踩: 0 回复
43楼彬彬博客  2012-09-30 15:08:14
注重原创,适当转载
顶: 0踩: 0 回复
44楼KanCBA  2012-09-30 10:58:01
老师的的这篇文章很受教,拜读了。祝老师和家人双节快乐,开心,顺利!
顶: 0踩: 0 回复
45楼79男人  2012-09-30 08:20:47
原创确实是硬道理
顶: 0踩: 0 回复
46楼免费商业源码  2012-09-30 03:50:53
松哥真是有见地,不过坚持原则是重要的啊!!!
顶: 0踩: 0 回复
47楼刘兆华  2012-09-30 02:02:49
还是需要认真思考和研究下
顶: 0踩: 0 回复
48楼得道SEO  2012-09-30 00:57:31
原创确实是硬道理
顶: 0踩: 0 回复
49楼群发软件下载  2012-09-30 00:26:44
谢谢松松老师的真诚分享!
首先祝松松老师节日快乐。
跟踪松松老师这么长时间。
感觉自己真的学到了很多。
我的网站被收录的页面很少,
看完这篇文章终于知道了怎么回事!
顶: 0踩: 0 回复
50楼日照网社区  2012-09-29 23:53:16
额~~~ 就是不收录怎么办?

顶: 0踩: 0 回复
51楼广州电信  2012-09-29 23:40:32
这东西,谁说得准。。互联网本来就这样,转来转去,早就不知谁是原创。。
顶: 0踩: 0 回复
52楼草鞋码头  2012-09-29 23:38:28
终于明白了,原来是这样的啊,明天就中秋节了,祝各位兄弟姐妹,节日快乐啊
顶: 0踩: 0 回复
53楼想搞网站  2012-09-29 23:21:04
原来是这样的,我们应该经常来学习
顶: 0踩: 0 回复
54楼儿童安全座椅什么牌子好  2012-09-29 23:17:44
难怪垃圾网站排名不会靠前的,当然权重也不会高的。
顶: 0踩: 0 回复
55楼国外新鲜资讯  2012-09-29 22:34:35
明白了学到了
顶: 0踩: 0 回复
56楼友众  2012-09-29 22:12:47
多点学习,努力消化中
顶: 0踩: 0 回复
57楼hostgator优惠码  2012-09-29 21:56:46
原来是这样啊,一直困惑中呢。
顶: 0踩: 0 回复
58楼丁力  2012-09-29 21:13:33
原来是这样的,我们应该经常来学习啊。
顶: 0踩: 0 回复
59楼免费天空网  2012-09-29 19:42:00
重复链接太多。。
顶: 0踩: 0 回复
60楼app  2012-09-29 19:24:01
最近总被某博客转载且不留来源和链接,对于这种现象,很多原创站长都会遇到,尽量和对方沟通,很多都会加上来源。
顶: 0踩: 0 回复
61楼闵非凡  2012-09-29 15:46:10
看了有点云里雾里~~~
顶: 0踩: 0 回复
62楼美丽说蘑菇街  2012-09-29 15:45:02
现金是不K你站~~就是让你没排名!!
顶: 0踩: 0 回复
63楼龙三公子  2012-09-29 15:26:50
听说一个网站引用的图片如果是同一个图片空间的,也会影响抓录,那怎么弄才最好?
顶: 0踩: 0 回复
64楼  2012-09-29 15:09:42
祝节日快乐啊,松哥。
顶: 0踩: 0 回复
65楼tui56  2012-09-29 14:31:49
tui56-王宝臣……有段时间没来松哥博客了!最近对于原创识别也在思考一些问题。之前百度对于文章收录,原创也就是最新被蜘蛛抓取索引到的文章,获得权重最高,然后其次。当同样一篇文章开始出现多个网站并且被收录后,慢慢的基本就没权重了……松哥博文中有一个删除论,在以前tui56-王宝臣发现3-6个月以内的网站,发布的文章内容长尾词一般一周内排名或者前3天还不错。完了7天以后慢慢的就找不到了。6个月以上的网站……竞争不激烈的排名才会开始稳定。以前的很多算法已经不能应用了……尤其是针对百度优化。8月10日站长门诊……lee其实直接说了.百度的原创识别机制在不久会越来越完善。最近8月28一直到现在9月底更新。很多站……不k了。让你没排名……只有原创才能更好的生存……
顶: 0踩: 0 回复
66楼流量计  2012-09-29 14:24:15
祝大家节日快乐
顶: 0踩: 0 回复
67楼来秀美  2012-09-29 13:59:22
我们网站有一个分类经常不被百度收录,文章也不经常收录,是怎么回事,是互动少了吗?
顶: 0踩: 0 回复
68楼王光卫中文博客  2012-09-29 12:41:47
智能化判断貌似需要更多的用户隐私
顶: 0踩: 0 回复
69楼左岸格调  2012-09-29 12:36:54
无语~
顶: 0踩: 0 回复
70楼大连电脑维修  2012-09-29 12:36:54
松松节日快乐,祝网站pv大涨哈
顶: 0踩: 0 回复
71楼焕妍坊  2012-09-29 12:28:08
以后需要多过来学习一下啊,做网站应该有一个平和的心态
顶: 0踩: 0 回复
72楼中国美术高考网  2012-09-29 11:54:33
说实话我也不太明白,不过文章很好
顶: 0踩: 0 回复
73楼潮乐购  2012-09-29 11:40:54
看不懂啊。。不知道要怎么做。。
顶: 0踩: 0 回复
74楼陈念  2012-09-29 11:33:06
应该是这么一个思路,先做权重,权重高了你的文章才不会被删除!
顶: 0踩: 0 回复
75楼旅途者  2012-09-29 10:43:46
看来是有个性才能生存……
顶: 0踩: 0 回复
76楼阿里妈妈博客  2012-09-29 10:24:26
说实话我是没看懂的了。
顶: 0踩: 0 回复
77楼如何做网站  2012-09-29 10:18:51
不错过来学习额
顶: 0踩: 0 回复
78楼小学生作文大全  2012-09-29 09:48:29
不管是原创还是转载,坚持更新才是最重要的
顶: 0踩: 0 回复
79楼腰椎间盘突出症的治疗方法  2012-09-29 09:30:32
哦,学习了~~谢谢松哥!
顶: 0踩: 0 回复
80楼购物分享  2012-09-29 09:27:54
学习了一把
顶: 0踩: 0 回复
81楼空渡.博客  2012-09-29 09:02:50
是的,百度喜欢这么干!原创才是王道!
顶: 0踩: 0 回复
82楼王坤  2012-09-29 08:03:10
要学习啊 搞不懂他们怎么搞的
顶: 0踩: 0 回复
83楼御宅族  2012-09-29 07:25:17
即使是原创,权重不高的话也会被挤下去的
顶: 0踩: 0 回复
84楼V9站长网  2012-09-29 05:29:57
单纯指望靠文章起家的时代已经过去了,很难再重现原创的辉煌,还得另辟蹊径。
顶: 0踩: 0 回复
85楼关键词排名提升工具  2012-09-29 00:29:56
看来就算是做伪原创,也要增加技术含量了,没那么简单了
顶: 0踩: 0 回复
86楼美标睡衣  2012-09-28 22:45:42
我的文章老是被收录又被删除了。
顶: 0踩: 0 回复
87楼水长东  2012-09-28 22:27:37
小站就是悲剧,就算是原创的,一转发,就没了。
顶: 0踩: 0 回复
88楼御宅族  2012-09-28 22:26:10
《搜索引擎如何识别重复网页》
顶: 0踩: 0 回复
89楼长沙seo  2012-09-28 22:08:21
研究的太透彻了
顶: 0踩: 0 回复
90楼两对半  2012-09-28 21:51:13
以前我很计较这事,现在已习惯了
顶: 0踩: 0 回复
91楼鹿胎膏  2012-09-28 21:31:49
感觉互联网的东西都是抄来抄去,毕竟没有那么多原创的东西
顶: 0踩: 0 回复
92楼推广者博客  2012-09-28 21:24:38
原创的排名不一定高。
顶: 0踩: 0 回复
93楼赵强的博客  2012-09-28 21:22:49
你的这篇并没有指出:这种情况下,站长们的原创是否会受到什么影响,以及站长们的文章会不会当作重复页面被删除?这是我所关心的。
顶: 0踩: 0 回复
94楼胡益博  2012-09-28 21:15:39
百度对于这方面的规则有待修正!
顶: 0踩: 0 回复
95楼电脑医生  2012-09-28 20:53:56
这个有必要多了解一下
顶: 0踩: 0 回复
96楼少女戏春潮  2012-09-28 20:42:35
转眼间就这么多评论了。
顶: 0踩: 0 回复
97楼似水流年  2012-09-28 20:25:48
嗯,真实的学习了一点知识
顶: 0踩: 0 回复
98楼43度  2012-09-28 20:17:14
好复杂啊,这个也算是搜索的算法里面考虑的吗
顶: 0踩: 0 回复
99楼43度  2012-09-28 20:16:55
好复杂啊,这个也算是搜索的算法里面考虑的吗
顶: 0踩: 0 回复
100楼户口网  2012-09-28 19:44:50
原创真的好难!!!!!
顶: 0踩: 0 回复
101楼luacloud  2012-09-28 19:39:22
唉,大站很多时候都掐头去尾,不经也不用负责任,所以都习惯了。
顶: 0踩: 0 回复
102楼周继松博客  2012-09-28 18:09:55
每一件事情要做好是不能偷懒的
顶: 0踩: 0 回复
103楼难人海  2012-09-28 18:05:41
了解了!
顶: 0踩: 0 回复
104楼鬼片电影  2012-09-28 17:44:47
百度就是这么牛 哈哈
顶: 0踩: 0 回复
105楼美丽说蘑菇街  2012-09-28 17:40:19
学习两招~这个有好用
顶: 0踩: 0 回复
106楼ylhn  2012-09-28 17:36:36
绝对看到眼前一亮
顶: 0踩: 0 回复
107楼衡水购物狂  2012-09-28 17:33:22
以后一定坚持原创
顶: 0踩: 0 回复
108楼天译时代  2012-09-28 17:21:50
原来如此,好多人都问过我这个问题,我都不晓得怎么回答人家 - -
顶: 0踩: 0 回复
109楼好玩  2012-09-28 17:02:03
我搬了一些自己原来博客的文章,也被当作复制。很郁闷。
顶: 0踩: 0 回复
110楼wifi共享精灵  2012-09-28 16:57:38
是的呢,这个我也表示很不解啊!
顶: 0踩: 0 回复
111楼张笛  2012-09-28 16:50:50
松哥,能不能把你博客的模版给我呢?我是个新手,前天刚接触wordpress。现在连模版,和结构什么的都不会设置。。[REVERT=好地瓜都不帅 于 2012-9-28 18:00:18 回复]已经有了。在右边的本站下载里。[/REVERT]
顶: 0踩: 0 回复
112楼博客赚钱  2012-09-28 16:42:16
搜索引擎,同样也有运行的潜规则!
顶: 0踩: 0 回复
113楼乐活时代购物  2012-09-28 16:40:13
很有用,坚持发原创文章去
顶: 0踩: 0 回复
114楼娄底SEO  2012-09-28 16:35:52
说的很有理啊
顶: 0踩: 0 回复
115楼左左小窝  2012-09-28 16:24:42
谢谢分享,又学到一些新东西!
顶: 0踩: 0 回复
116楼进口车资源网  2012-09-28 16:03:08
博客做的不错,来踩踩,求回访!
顶: 0踩: 0 回复
117楼诚逸SEO  2012-09-28 15:56:24
确实,重复内容的页面是很难长久的,一般会过段时间有所变化的。也属于正常现象
顶: 0踩: 0 回复
118楼纯水设备  2012-09-28 15:35:21
原来如此,难怪收录有时候在减少!
顶: 0踩: 0 回复
119楼闵非凡  2012-09-28 15:26:54
是的呀,我的博客的文章就被别拿去了,连个名字都没留。。。
顶: 0踩: 0 回复
120楼王二  2012-09-28 15:07:20
重复算法真的很痛疼。。既希望自己的原创文章能排在前面,又希望转载的文章也能排在前面,,这是广大站长的心情。。
顶: 0踩: 0 回复
121楼Programmsdn  2012-09-28 14:27:54
文章质量很好。很专业。 连搜索引擎核心部分的思路松哥你都能分享!!厉害啊
顶: 0踩: 0 回复
122楼光的传人  2012-09-28 14:26:23
度娘根本分不清楚什么是原创~
顶: 0踩: 0 回复
123楼纤蝶  2012-09-28 14:26:21
原创文章也容易被搞掉,权重不够高的话
顶: 0踩: 0 回复
124楼媚博  2012-09-28 14:15:44
天下文章一大抄,如果你没有做好被人家给转载、山寨的准备,就不要原创了,最烦的就是打着什么知识产权、专利的旗号了[REVERT=威客任务 于 2012-9-28 16:29:46 回复]前半句同意,后半句观点不敢认同。[/REVERT]
顶: 0踩: 0 回复
125楼seo分享  2012-09-28 13:51:05
分析的很精彩
顶: 0踩: 0 回复
126楼逗趣街搞笑视频网站  2012-09-28 13:44:56
哈哈,说的有理,学习了
顶: 0踩: 0 回复
127楼即时比分  2012-09-28 13:37:47
自己写的文章被转载后要么排名消失、要么转载站排在前面,这是为什么呢?[REVERT=威客任务 于 2012-9-28 16:25:08 回复]你的网站排名在转载站之后,引擎认为转载站才是原创,而你却是山寨者,所以消失或是在后面。[/REVERT]
顶: 0踩: 0 回复
128楼江门就医网  2012-09-28 13:31:11
坚持原创很重要啊
顶: 0踩: 0 回复
129楼数字制造网  2012-09-28 13:30:39
这个还真不知道呢
顶: 0踩: 0 回复
130楼seo博客  2012-09-28 13:22:25
呵呵 我说我的文章 今天收录了,明天就找不到了
顶: 0踩: 0 回复
131楼海纳百川  2012-09-28 13:13:08
都是原创的文章,为何有些还是不太容易被收录呢,可能文章质量不行吧。
顶: 0踩: 0 回复
132楼淘作文  2012-09-28 13:04:20
干货啊,得好好研究下
顶: 0踩: 0 回复
133楼四季新娘网  2012-09-28 13:01:56
所以现在做淘宝的网站,也不好混啊。重复的站太多了。
顶: 0踩: 0 回复
134楼html6game  2012-09-28 12:58:18
偶现在也遇到这样的问题,头也大了。
顶: 0踩: 0 回复
135楼小蝌蚪网  2012-09-28 12:48:40
小站,不原创不行,原创了被转载还没有带连接那就惨了。。
顶: 0踩: 0 回复
136楼木马随风转  2012-09-28 12:34:49
我想估计也没有人转载我的文章吧
顶: 0踩: 0 回复
137楼汪棒棒  2012-09-28 12:24:05
重复内容一定要保留原作者和原文。
顶: 0踩: 0 回复
138楼泷泽萝拉  2012-09-28 12:24:00
哈哈,工作原理是这样的。
顶: 0踩: 0 回复
139楼编程入门  2012-09-28 12:23:11
原来内容重复在百度那里有4中类型呢
顶: 0踩: 0 回复
140楼重庆SEO推广  2012-09-28 11:58:48
确实说到了实处,不过如果是内页部分伪原创 ,这是怎么识别的呢
顶: 0踩: 0 回复
141楼游戏浏览器  2012-09-28 11:51:24

这就是为什么你想做的关键字总没有排名,反而不想做的关键词却能排名靠前的原因之一,搜索引擎把它认为不重要的词语删除了。关键词去重。
顶: 0踩: 0 回复
142楼螃蟹博客  2012-09-28 11:42:23
天天来,天天都能学到新东西。是我菜~!
顶: 0踩: 0 回复
143楼杨红林博客  2012-09-28 11:41:48
松松大哥,我的博客不知道怎么回事,一下没快照了。而且以前的关键词位置也没有了。我检查了友情链接,也检查了最近是不是发了什么非法的,好像都没有。我看友情链接的时候看到我的近一半的朋友的站也没有了快照。是站长工具问题,还是我们网站问题还是百度改变了算法?希望过几天会好,等起。不知道大家有没有这种情况,欢迎大家到我博客看看。先谢谢各位!
顶: 0踩: 0 回复
144楼天边鱼  2012-09-28 11:40:10
懒得关注
顶: 0踩: 0 回复
145楼草根减肥博客  2012-09-28 11:21:31
小站在这方面一点优势也没有啊
顶: 0踩: 0 回复
146楼seo技术交流博客  2012-09-28 11:17:20
现在很多原创网站的文章排名都没有转载的网站排名高啊,这也是原创站长们的一大悲哀吧
顶: 0踩: 0 回复
147楼小兽SEO  2012-09-28 11:10:36
复制粘贴去重~百度应该在加深算法~去重也没有什么必要~
顶: 0踩: 0 回复
148楼小云子  2012-09-28 10:56:35
还真不知道这个
顶: 0踩: 0 回复
149楼青春励志文章  2012-09-28 10:53:37
不错,学习了,按照搜索引擎的需求去做
顶: 0踩: 0 回复
150楼标语大全  2012-09-28 10:52:43
抓取页面的时候删除,这样可以减少搜索引擎带宽以及减少存储数量。

顶: 0踩: 0 回复
151楼在家怎么赚钱  2012-09-28 10:50:22
百度排名是门很深的学问,学习了。
顶: 0踩: 0 回复
152楼花瓣儿  2012-09-28 10:38:40
相对来说,谷歌的页面有很多重复的
顶: 0踩: 0 回复
153楼广州SEO  2012-09-28 10:37:53
我的网站直接被人家做镜像
顶: 0踩: 0 回复
154楼囧囧seo博客  2012-09-28 10:36:48
原来是这样啊 松哥 我受教了
顶: 0踩: 0 回复
155楼营销叛将  2012-09-28 10:26:27
松哥,我个人觉得有质量的转载并且带上出处,如果也带上原文链接,这是一个站长应该做的,至少这是对原作者工作的一种尊重。但就国内的互联网来说,转载就意味着伪原创,掐头去尾也不不说,有的转载简直就是改称呼改标题,改链接,插链接,其他的基本不变。我前几天写过一篇《Apple打造赚钱机器缔造商业帝国的5个营销之道》的文章,转载之后把“营销叛将”改成“陈Sir”,还在文章底部郑重其事宣明,本文由“陈Sir”原创,转载请注明某某链接,看着不说很受伤,只是觉得为这类人感到悲哀。如果网站的用户,每一个网名都知道这种现象或者真实的情况,我不知作何感想。拿我个人来说,我以前非常佩服一个叫“营销魔术师”的家伙,真的,在中国网络营销界我看得上,在以前也就仅仅只是他一个人,但后来我发现他在天价的培训课程中的某些内容竟然是原模原样复制亚伯拉罕的东西,唯一不同的是把英文变成了中文,怎么说呢,他在我心目中的地位也就随之一落千丈了。当然,我相信这是转载的一种其他形式,但转载别人的东西,拿来为自己赚钱服务,这多少有些不厚道,假如潜在顾客或客户知道这些真相和内幕之后,花几万块钱做这种形式的培训,是值得高兴还是值得难受呢?
顶: 0踩: 0 回复
156楼郭优博客  2012-09-28 10:21:44
原来是这样,一直困惑中
顶: 0踩: 0 回复
157楼设计2点半  2012-09-28 10:20:35
网络上重复的内容太多太多了
顶: 0踩: 0 回复
158楼蘑菇成长网  2012-09-28 10:15:53
删除重复的垃圾文章是有好处的
顶: 0踩: 0 回复
159楼后箱盖  2012-09-28 10:15:47
如果搜索引擎对重复页面查看的更严的话,转载的恐怕也就没有多少空间了
顶: 0踩: 0 回复
160楼php二次开发  2012-09-28 10:15:09
额,怎么多人了?
顶: 0踩: 0 回复
161楼拾穗者博客  2012-09-28 10:06:57
确实有这样的问题!很伤啊~
顶: 0踩: 0 回复
162楼截止阀  2012-09-28 10:04:23
我也觉得转载别人的还是要保有原创者姓名和出处链,但是如果有改动了的话可以不必要
顶: 0踩: 0 回复
163楼策划那些事儿  2012-09-28 10:02:59
这个值得好好研究下
顶: 0踩: 0 回复
164楼青岛网络推广  2012-09-28 10:02:09
这个原理还真是不清楚
顶: 0踩: 0 回复
165楼合肥SEO  2012-09-28 10:00:32
我的博客本来收录就有点慢,所以有时被人转载了真的很受伤。。。
顶: 0踩: 0 回复
166楼企业文化  2012-09-28 09:45:38
这个看来很关键,重复性的太多了!
顶: 0踩: 0 回复
167楼武汉seo疯子  2012-09-28 09:44:47
内容还是保持原创,提供给用户需要的信息,才是最主要的!
顶: 0踩: 0 回复
168楼周继松博客  2012-09-28 09:38:26
以后一定坚持原创
顶: 0踩: 0 回复
169楼李国伟  2012-09-28 09:36:21
额。。原来是这样啊。顶了。
顶: 0踩: 0 回复
170楼论文发表  2012-09-28 09:35:30
哇,占到沙发了,哈哈[REVERT=起点博客 于 2012-9-28 13:46:14 回复]学习了,这样删除[/REVERT][REVERT=起点博客 于 2012-9-28 13:47:53 回复]重复内容的排名规则是怎么算的呢[/REVERT]
顶: 0踩: 0 回复
171楼周继松博客  2012-09-28 09:34:58
抢沙发,只有时时关注卢松松博客的人才能抢到沙发[REVERT=梦寒博客 于 2012-9-28 23:37:09 回复]又被你抢去了,沙发的位置又没得做了 啊啊啊啊啊啊[/REVERT]
顶: 0踩: 0 回复