码迷,mamicode.com
首页 > 其他好文 > 详细

DEDE采集

时间:2014-07-30 23:13:15      阅读:229      评论:0      收藏:0      [点我收藏+]

标签:使用   html   div   htm   图片   文档   class   c   

1、随机模版
 
你可以多复制N多模版,在body内容标记附近稍微修改一下。你每次变换模板时,别人再按以前规则采集时就可采不到内容,只要你的模版够多,人家就失去耐性,放过你了。
 
缺点:就是要复制N多模版,麻烦
 
2、防采集字符混淆
 
在body表示是插入大量混淆字符别人采集也一并把混淆字符采集过去了。
 
缺点:有可能对SEO造成影响,对于图片站来说,假如别人不在乎你的混淆字符的话,人家照样采集,别人下载你的图片给你带来过大的流量。
 
3、还有一个好的解决办法(推荐)
 
在body标记附近的<div class=”abc”>修改成<div class=”abc {dede:field.id/}”>,注意是空格+{dede:field.id/},这样div的class还是没有变,但产生了<div class=”abc 文档ID”>,或者在html标记里插入id={dede:field.id/},比如<div id={dede:field.id/}> <body id={dede:field.id/}>注意如果当前的html标记有存在的ID最好不要再插入了。
 
让采集者写规则的时候没办法找到相同的,他就没办法写了,如果他连<div class=”abc 文档ID”>也采集进去的话,你就在<div class=”abc 文档ID”>前面的有class的地方照样这样做。
 
当然,别人可以使用过滤规则来去掉,但是假如我在所有的class里插入文档ID,或者插入id=文档ID这样的。那他就采集整个页面然后再过滤吧。
 
缺点:如果插入{dede:field.id/}不够多的话别人可以用过滤规则过滤掉。

DEDE采集,布布扣,bubuko.com

DEDE采集

标签:使用   html   div   htm   图片   文档   class   c   

原文地址:http://www.cnblogs.com/xinlinux/p/3879019.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!