参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
1.变量的命名变量名由字母、数字或下划线组成,首字母必须是字母或下划线。2.变量的赋值Python中的变量不需要声明,变量的赋值操作既是变量声明和定义的过程。每个变量在内存中创建,都包括变量的标识,名称和数据这些信息。每个变量在使用前都必须赋值,赋值后该变量才会被创建。3.局部变量局部变量是只能在函...
分类:
编程语言 时间:
2014-04-28 07:09:02
阅读次数:
604
wxwidget官方建议的工具集合:http://wiki.wxwidgets.org/Tools支持wxpython可视化开发工具wxFormBuilderwxGladewxDesignerVisualWX
分类:
编程语言 时间:
2014-04-28 06:37:32
阅读次数:
846
1.元组(tuple)元组由不同的元素组成,每个元素可以储存不同类型的数据,如字符串、数字甚至元组。元组是写保护的,即元组创建后不能再做任何修改操作。1.1元组的创建Tuple(元组)由一系列元素组成,所有元素被包含在一对圆括号中。创建元组时可以不指定元素个数,但一旦创建后就不能修改长度元组的创建格...
分类:
编程语言 时间:
2014-04-28 06:33:27
阅读次数:
711
近日,研究Tencent网页模拟登录的过程,过程有些忐忑。先将结果写于此,供大家参考:其加密过程在c_login_old.js文件中执行,将JS关键代码提取出来如下:function
hexchar2bin(str) { var arr = []; for (var ...
分类:
编程语言 时间:
2014-04-28 06:23:24
阅读次数:
1141
linux下,framebuffer设备文件名通常是/dev/fb0,1,2等。控制framebuffer设备的一般步骤如下:1)
打开设备,映射framebuffer2)依照硬件要求,准备好数据3)把数据复制到framebuffer例子程序如下:1)打开设备,映射framebufferstatic...
分类:
系统相关 时间:
2014-04-28 06:03:48
阅读次数:
843
1下载驱动库http://sourceforge.net/projects/mysql-python/2,yum install mysql-dev*yum
install python-dev*3,python setup.py install
分类:
数据库 时间:
2014-04-28 05:40:20
阅读次数:
634
3.1 Installing mod_pythonTo install mod_python,
we simply run:yum install mod_python3.2 Configuring ApacheNow we must configure
Apache so that it can ...
分类:
编程语言 时间:
2014-04-28 04:52:46
阅读次数:
735
VUE 源码分析简介Vue是 MVVM
框架中的新贵,如果我没记错的话作者应该毕业不久,现在在google。vue
如作者自己所说,在api设计上受到了很多来自knockout、angularjs等大牌框架影响,但作者相信 vue
在性能、易用性方面是有优势。同时也自己做了和其它框架的性能对比,在这...
分类:
Web程序 时间:
2014-04-28 03:02:14
阅读次数:
1361
framebuffer简介
帧缓冲(framebuffer)是Linux为显示设备提供的一个接口,把显存抽象后的一种设备,他允许上层应用程序在图形模式下直接对显示缓冲区进行读写操作。framebuffer是LCD对应的一中HAL(硬件抽象层),提供抽象的,统一的接口操作,用户不必关心硬件层是怎么实....
分类:
系统相关 时间:
2014-04-27 23:18:13
阅读次数:
915