??
(1)快照是百度蜘蛛抓取了网站内容的一个体现,比如今天百度快照更新了,说明百度今天来抓取了你网站的内容。百度快照本质只是证明引擎爬过该页,在索引及总库里会增加这么条数据。百度通过快照内容建立索引信息,通过快照内容,可以更快了解所查找的信息。
(2)如果无法打开某个搜索结果,或者打开速度特别慢,可以通过“快照”快速浏览页面文本内容。百度快照只会临时缓存网页的文本内容,所以...
分类:
其他好文 时间:
2014-12-02 09:02:19
阅读次数:
171
当网站流量被下载应用或蜘蛛占满,可采用nginx的来做限速#1、适合用静态文件下载目前在121配置(文件类型)location~.*\.(gif|jpg|jpeg|png|bmp|swf|doc|xls|rar|zip|pdf|ppt)$
{
limit_rate_after800k;
limit_rate100k;
expires1d;
}##当传输量(下载)大于8M时,超出部分将限速(1..
分类:
其他好文 时间:
2014-09-24 16:28:37
阅读次数:
199
通过网站访问日志我们可以看见很多蜘蛛爬行记录。搜索引擎都遵守互联网robots协议,是放置在网站根目录下robots.txt文本文件,在文件中可以设定搜索引擎蜘蛛爬行规则,以及设置搜索引擎蜘蛛Spider抓取内容规则。通过robots.txt来进行限制,首先在网站跟目录下面建立一个robots...
分类:
其他好文 时间:
2014-09-18 16:58:24
阅读次数:
195
百度蜘蛛喜欢静态网站,所以一些技术人员在使用其它程序建站时也会采取一些方法将其处理成伪静态的形式。网站伪静态故名思议,就是不会生成实体的静态页面文件,它只是以.html一类的静态页面形式,且用PHP程序动态脚本来处理的就是网站伪静态,它是大多seoer所关心的话题。网站伪静态有哪些好处,可以从哪.....
分类:
Web程序 时间:
2014-08-18 23:27:53
阅读次数:
349
百度蜘蛛的更新策略:我们知道蜘蛛并不是只抓取我们网站一次,而是按一定的更新频率来抓取我们的网站,在本地进行一个“镜像”从而保证被抓取的网页参与排名时呈现给用户的是最新的(咳咳,不新也要保证差不多嘛!毕竟资源有限)。那么这个更新策略跟什么有关呢?
1.用户体验:用户一般在搜索一个关键词的时候,顶多看两三页左右,基本很少看后面的页面,而搜索引擎本着优先更新大部分客户所需要内容的原则,所以搜索引擎...
分类:
其他好文 时间:
2014-05-13 08:18:25
阅读次数:
286