码迷,mamicode.com
首页 > 其他好文 > 详细

百度是如何识别原件及伪原创文章?

时间:2015-09-27 22:49:51      阅读:195      评论:0      收藏:0      [点我收藏+]

标签:

1.文章锚文本链接:如果在同一篇文章,转发每个站点。如果有纸张的锚文本链接指向同一个网站,然后在里面,这无疑将成为百度确定,但增加了原装芯片。


  2.keyword频次:在这里,我们需要知道一个名词:“指纹信息”。信息指纹类似人的指纹,网站管理员、度截取相应文字。然后根据一定的算法,将文字及其权重设为编码,这些文字可能是几个字符,可能是一句话或几句话。一般一篇文章相应多个信息指纹,假如你的文章是原创性的文章的话,百度会根据信息指纹推断。


  3.文章公布时间:同样的一篇文章。公布并且被百度录入的时间越早,越easy被百度觉得是原创文章。


  4.文字次序:假如两个文本的信息指纹彻底同样的话,理论上可以觉得两个文本彻底同样,可是实际上却不是这样,已然百度会截取选定的字符作为信息指纹的编码,那么经过打乱这些字符的次序也可以得到不一样的信息指纹。




  经过以上几点咱们不难发现。本来一些SEO所谓的伪原创办法在百度看来是如此的“小儿科”,以下的几种伪原创办法都是不可取的:


  1.调整阶段次序:这个就不多说了。简略调整次序是不能起不论什么的伪原创的作用的。


  2.图像更换法:我记住以前见到过有站点使用图像替代中止词及标点符号,这么假如是纯粹为了让百度以为是伪原创的话我以为就太可笑了,但是这样的办法不失为一种防止信息效仿的好办法。一句话,对百度没用,对用户实用。


  3.keyword更换:SEO市场上流行着各种伪原创东西。根本上都是依托keyword更换而来,经过建立一定量的近义词词库,使文章内近义词彼此更换而到达伪原创的效果,我曾手动整理了两万多近义词进行实验。根本效果不大,因为keyword可更换的词相对来说太少,一篇文章全体更换后也就缺少可阅读性了。




  4.修正首段及结尾:这是绝大部分SEO选用的办法。一起也被广大同仁所认可,修正首段及结尾就行让百度以为是伪原创么?本人以为不一定,当改动不足以影响主keyword频率的时候是不能起到不论什么效果的,百度看它和转载的文章没有两样。


  当然另一些其它办法。例如几篇文章整合为一篇文章、调用上一篇或下一篇文章描述等。,在百度意见,这些方法往往不是一个实用的方法。

版权声明:本文博主原创文章。博客,未经同意不得转载。

百度是如何识别原件及伪原创文章?

标签:

原文地址:http://www.cnblogs.com/gcczhongduan/p/4842785.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!