-
2017年7月7日,百度正式推出“飓风算法”
从官方文档中来看,飓风算法的命中对象是站点,而不是网页;主要是针对以恶劣采集为内容主要来源的网站,而不是所有包含恶劣内容的站点。
哪些内容算是恶劣采集?恶劣采集内容,一般是指没有花费时间,精力,专业能力,人工整合的内容,或者说对用户没有任何附加价值的内容。
这部分内容有以下几种类型:
1、从其他站点采集的内容
包括整个页面内容都是采集、主题内容是采集,或者多篇采集拼凑成的内容。这种类型内容很容易被识别。
2、采集之后轻度加工的内容
包括修改了部分词语,修改了部分句子,或者使用单词批量替换的形式(部分伪原创工具)。这种类型的识别难度稍微大一点。
3、从某些动态站点采集的内容
包括采集其他搜索引擎的搜索结果,采集新闻feed流。
注意几个要点:主体内容、恶劣采集、附加价值。
哪些内容不算是恶劣采集?
也有朋友问,为什么有些网站也是采集的,但没有受到影响,比如某doc、某浪。其实只要做到某个要点,就不算是恶劣采集,这个要点就是:给用户带来附加价值。
附加价值有站点增益和内容增益两种。这个时候可以引用百度搜索技术博客《浅谈互联网页面价值》的一段内容:
某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益。另一方面,它在转载过程中可能会改变页面的标题,而且依托其受众,在转载页面上,还有可能出现更多的有价值评论和回复等,还有可能存在指向其它相关事件的新闻链接。这些可以被称之为内容增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。
同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名/稳定性/速度的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。
综上所述,对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。
这里的要点是:页面价值、增益
因此说,只要能够带来站点增益,内容增益,给用户带来附加价值,那就表明这个网页有其独特的价值,是不会被飓风算法命中的。
自百度推出“飓风算法”,首先中招的有这些大家熟悉的站。
7月7日中枪网站,大部分是范文类
7月6日中枪网站,大部分是范文类
躺枪案例:
t262.com
sanwen8.cn
被飓风算法影响怎么办?
针对飓风算法的影响,百度一个朋友透露说:
飓风算法主要是针对没有价值的采集,一旦中招没有任何解法。而被误伤的优质原创可以通过反馈中心申诉。
因此,一旦被飓风算法命中,只要不是明显误伤,短期内都没有办法解决。(被搜素引擎算法命中,一般都是普遍存在的,不被搜素引擎接受的做法,一般没办法申诉,Google也是如此。只有人工处理的能申诉。)
如何避免被飓风算法命中
采集会被算法惩罚,而内容完全原创,成本又非常高。那如何生成内容,而又不被飓风算法惩罚呢。其实还是围绕内容增益上去解决,有几个解决方法:
1、增加用户点评模块
页面增加用户点评模块,当有用户点评之后,点评内容也会成为网页内容的一部分,产生了额外价值。作为用户,在阅读完内容之后,也希望看一下真实用户的意见,比如这个内容是否属实,信息是否失效,有没有额外的提醒等。
不过要注意的是,点评内容最好是在源码中实现,而不是在JS中(方便搜素引擎识别)。
推荐工具:友言,wumii(不保证内容出现在源码中)
实现难度:★★★
安全程度:★★★★
示例:网易新闻跟帖
2、增加内容推荐模块
根据网页主题,添加相关的内容模块,比如延伸阅读,之前报道,相关阅读等。作为用户,可以更加详细完整的了解事件的发展,比如关于“张艺兴”的一篇新闻,可以了解他之前参加过什么活动,有什么绯闻,参与的极限挑战的进展情况等。这些对用户来讲,都是非常有价值的。
实现思路:一种是人工编辑;一种是算法实现,比如根据TF-IDF提取出主体关键词,再拿关键词去跟历史内容匹配。
实现难度:★★★★
安全程度:★★★★
示例:网易新闻下的延伸阅读
3、内容整合
示例:网易 - 香港回归20周年专题
根据主题,将多篇内容整合为一篇。跟之前内容相比,整合后的内容更加丰富,可以满足用户更多需求。比如一篇“梦见老虎”的内容,如果能够添加“梦见老虎吃人”、“梦见被老虎追”等内容,将会更可能命中用户的梦境。
另一种比较常见的就是专题页,将相关主题的内容全部组织起来,按照重要程度安排内容布局。这种专题页有运营小伙伴编辑的,也有程序生成的(使用开源搜索引擎,比如Lucene,Sphinx,Xapian)。
4、申请百度原创
如果确实是优质原创内容,还是推荐加入百度原创保护项目。目前这个项目在内侧阶段,需要百度邀请加入。
如果你的网站已经中了“飓风”,如何恢复网站排名呢?以武汉seo看来,你只能照如此做,然后看百度的反应吧。
1、如果你采集了,请自行删除采集内容,并用robots.txt进行处理,坚持原创,坐等百度老太太给你伸出橄榄枝;
2、警告:如果你的内容都是抄袭的,而且每天发布数量较多(超过100条且没多少原创),即便没采集,估计将来也会中飓风,百度目前的思想是建立一个绿色生态,他老人家并不希望互联网上有大量重复的内容,因为没有价值。
3、随着数据的增加,百度也肯定恼火大量重复内容给搜索引擎带来的困扰,因为你去做搜索引擎,也不希望遇到这种麻烦,成本问题、算法问题、大站建立群站骗取流量问题,都头疼。
4、时代变了,将来能够存活下来的站点,一定是有较多高质量原创内容的网站,内容为王的时代已经开启革命,也只有这样,百度才有玩内容推介的资本,才不会被大量自媒体分走流量和客户,事关存亡,百度不会希望中国也出现一个facebook,微信自媒体、头条等,一个是社交流量,一个是原创生态,都越来越强大。
(本文由武汉seo-www.shuaii.com原创,未经允许不得转载!)
顶: 9 踩: 3相关阅读:
来源:卢松松博客 QQ/微信:13340454
网站中了“飓风算法”,老站长带你实战分析
| 阅读量 | 分类: 建站教程 | 作者: 读者投稿
相关文章阅读更多:SEO优化 百度
- 2024-11-06 满屏都是百度竞价广告,网站seo优化还能做吗?
- 2023-09-27 百度搜索逐步恢复优质网站权限
- 2023-09-06 被百度判定为低质量网站了!如何整改?
- 2023-08-17 SEO是人人都可以挖的金矿,SEO终极算法第四部!
- 2023-08-11 公众号垂直SEO领域3万粉丝,做对了什么?
- 2023-07-01 网站建设与网站推广哪个流量大?说说SEO关键词怎么选
- 2023-06-15 Google SEO怎么做?谷歌seo优化包含哪些内容?
- 2023-04-26 跨境电商卖家如何用SEO的思维提升排名
- 2023-04-09 本地生活商业流量SEO怎么做?
- 2023-02-20 对话ChatGPT,微信SEO怎么做及搜商与问商是什么
- 2023-02-15 百家号卡位排名是什么意思及怎么优化
- 2023-02-14 百度流量闭环了,SEO还能怎么搞
- 2023-01-20 SEO转型系列之十二,SEO如何转行私域流量运营?
- 2023-01-20 2023年了,做百度SEO还有出路吗
- 2021-09-08凡是在卢松松博客投稿的作者都有机会得到IT类图书哦!
发表感想加入微信群
网秀科技
好好做内容才是王道啊。
2017年最新赚钱软件
欢威
武汉兰姐月嫂
做个站不容易
社区资讯网
地段影视
快速排名推送者
化验员
17年靠谱赚钱软件
杭州华育国际
多多原创 文章要有价值 要使用户体验好 这样真的很浪费时间和精力 一篇优质的原创要花费很多的时间和精力
手卷钢琴
香港服务器
韩版女装
2017年靠谱赚钱软件
齐家364
17年靠谱赚钱软件
香港服务器
那么多赚钱项目还不如这100撸的开心
暴利项目老傅
不会原创
起码要会伪原创
如今依然是内容为王的时代
行业大洗牌
云盘影视
香港服务器
网站推广资源
输送带厂家
山东公园椅
之心网赚
安徽人事考试网
汽车冲压件
灯具货源资讯
重庆礼品公司
这一段很赞同,百度也要变,不改变就是温水煮青蛙
上海日月星养老院
2017最新赚钱软件
文山三七
17年靠谱赚钱软件
手表回收
昆明装修公司
昆明装修公司
昆明装修公司
小羊毛网赚
高新技术企业认定
便携式粗糙度仪
2017年靠谱赚钱软件
无双网赚
土鳖哥博客
文学阁小说
夏日博客
前沿营销学院
如果不打击,那么百度飓风算法的意义呢?
还是说欺软怕硬?只敢打击小站?
如果真的做到一视同仁。是不是意味着又要回答人工分类目录时代。
天天讲用户体验,那么什么是用户体验呢?对大多数人有用?那么我再大多人都认可的情况下原文转载了这篇文章,是不是意味着没事?不在飓风算法之内。如此类推。
假设我所有的文章都是按照以上思路来的,并且预计在后来可能能产生预期效果,那么是不是意味着百度飓风算法是不是就是个摆设。
我想说所谓的用户体验:准确的来说就只应该是“用户需求”吧。
不锈钢冲孔网
镀锌石笼网
而且,有价值的不一定是原创,原创不一定有价值哦
泪雪博客
萌宠博客
而且,有价值的不一定是原创,原创不一定有价值哦
17年靠谱赚钱软件
实验室装修
网赚
蒸汽回收机
网赚乎
手表回收
网赚项目博客
好好做内容才是王道啊。