DEDE采集

时间：2014-07-30 23:13:15 阅读：229 评论：0 收藏：0 [点我收藏+]

标签：使用 html div htm 图片文档 class c

1、随机模版

你可以多复制N多模版，在body内容标记附近稍微修改一下。你每次变换模板时，别人再按以前规则采集时就可采不到内容，只要你的模版够多，人家就失去耐性，放过你了。

缺点：就是要复制N多模版，麻烦

2、防采集字符混淆

在body表示是插入大量混淆字符别人采集也一并把混淆字符采集过去了。

缺点：有可能对SEO造成影响，对于图片站来说，假如别人不在乎你的混淆字符的话，人家照样采集，别人下载你的图片给你带来过大的流量。

3、还有一个好的解决办法（推荐）

在body标记附近的<div class=”abc”>修改成<div class=”abc {dede:field.id/}”>，注意是空格+{dede:field.id/}，这样div的class还是没有变，但产生了<div class=”abc 文档ID”>，或者在html标记里插入id={dede:field.id/}，比如<div id={dede:field.id/}> <body id={dede:field.id/}>注意如果当前的html标记有存在的ID最好不要再插入了。

让采集者写规则的时候没办法找到相同的，他就没办法写了，如果他连<div class=”abc 文档ID”>也采集进去的话，你就在<div class=”abc 文档ID”>前面的有class的地方照样这样做。

当然，别人可以使用过滤规则来去掉，但是假如我在所有的class里插入文档ID，或者插入id=文档ID这样的。那他就采集整个页面然后再过滤吧。

缺点：如果插入{dede:field.id/}不够多的话别人可以用过滤规则过滤掉。

DEDE采集,布布扣,bubuko.com

DEDE采集

标签：使用 html div htm 图片文档 class c

原文地址：http://www.cnblogs.com/xinlinux/p/3879019.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行