参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
在使用opencv的过程中,无论使用原始的IplImage和CvMat类型,还是用最新C++版本的Mat类型,在创建和使用过程中,经常会遇到CV_8UC1、CV_8UC3、CV_32FC3等声明,我以前也经常遇到,曾经看懂了,现在又忘记了,现在把它写下来,方便以后查看,遇到同样问题的菜鸟也能尽快.....
分类:
其他好文 时间:
2014-04-28 10:38:57
阅读次数:
539
wxwidget官方建议的工具集合:http://wiki.wxwidgets.org/Tools支持wxpython可视化开发工具wxFormBuilderwxGladewxDesignerVisualWX
分类:
编程语言 时间:
2014-04-28 06:37:32
阅读次数:
846
1.元组(tuple)元组由不同的元素组成,每个元素可以储存不同类型的数据,如字符串、数字甚至元组。元组是写保护的,即元组创建后不能再做任何修改操作。1.1元组的创建Tuple(元组)由一系列元素组成,所有元素被包含在一对圆括号中。创建元组时可以不指定元素个数,但一旦创建后就不能修改长度元组的创建格...
分类:
编程语言 时间:
2014-04-28 06:33:27
阅读次数:
711
近日,研究Tencent网页模拟登录的过程,过程有些忐忑。先将结果写于此,供大家参考:其加密过程在c_login_old.js文件中执行,将JS关键代码提取出来如下:function
hexchar2bin(str) { var arr = []; for (var ...
分类:
编程语言 时间:
2014-04-28 06:23:24
阅读次数:
1141
1下载驱动库http://sourceforge.net/projects/mysql-python/2,yum install mysql-dev*yum
install python-dev*3,python setup.py install
分类:
数据库 时间:
2014-04-28 05:40:20
阅读次数:
634
3.1 Installing mod_pythonTo install mod_python,
we simply run:yum install mod_python3.2 Configuring ApacheNow we must configure
Apache so that it can ...
分类:
编程语言 时间:
2014-04-28 04:52:46
阅读次数:
735
Emgu
CV是.NET平台下对OpenCV图像处理库的封装,也就是.NET版。可以运行在C#、VB、VC++等。安装完成后需要设置环境变量,比如我安装在D:\Emgu\emgucv-windows-universal-cuda
2.9.0.1922,然后再系统环境变量添加D:\Emgu\emguc...
分类:
其他好文 时间:
2014-04-28 04:50:47
阅读次数:
929
此系列文章只是OpenCV
tutorials的学习和总结。网址:http://docs.opencv.org/doc/tutorials/tutorials.html基础OpenCV入门包括以下内容:OpenCV介绍---------------------------------学习如何安装Op...
分类:
其他好文 时间:
2014-04-27 22:34:28
阅读次数:
503