参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
不是所有的函数都能自动地从基类继承到派生类中的。构造函数和析构函数是用来处理对象的创建和析构的,它们只知道对在它们的特殊层次的对象做什么。所以,在整个层次中的所有的构造函数和析构函数都必须被调用,也就是说,构造函数和析构函数不能被继承。另外,operator=
也不能被继承,因为它完成类似于构造函....
分类:
其他好文 时间:
2014-04-28 17:31:28
阅读次数:
621
在上个月的对C#开发微信门户及应用做了介绍,写过了几篇的随笔进行分享,由于时间关系,间隔了一段时间没有继续写这个系列的博客了,并不是对这个方面停止了研究,而是继续深入探索这方面的技术,为了更好的应用起来,专心做好底层的技术开发。微信的很重要的一个特点就是能够利用其平台庞大的用户群体,因此很容易整合在...
分类:
微信 时间:
2014-04-28 17:04:07
阅读次数:
1161
NABC模型:N(需求):通过软件控制汽车安全系统,当汽车主人不在时,通过语音识别,并与主人手机连接,通知车主。A(方法):通过盗车者的说话音色判断,避免了盗车者通过改变音调(故意将声音弄尖,或放低),来混淆判断力。及时反馈给车主,随时监听车内状况。B(好处):克服了传统的机械式防盗的笨重特点和GP...
分类:
其他好文 时间:
2014-04-28 16:40:30
阅读次数:
485
PHP里做一般的获取内容时,用自带的file_get_contents()函数基本就足够了。当然,这个函数只能抓一些简单的数据,如果是遇到需要登录的页面,就不行了,而且效率及稳定性也不是很强。所以要是有特殊需求的话,还是用curl吧。不仅仅速度快,而且非常稳定,基本上用curl抓取失败的几率很小。而...
分类:
Web程序 时间:
2014-04-28 16:28:42
阅读次数:
763
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
一、心火
心火的症状:失眠、心烦、焦虑(舌尖会比较红、长口疮),容易失眠上火的原因:着急、劳心降心火的方法:连子心茶、黄连阿胶汤、牛黄清心丸、导赤散中医助眠药:中医没有治失眠的药物,它只是把导致失眠的原因祛除,所以这些药不会在失眠药里面出现,但是它们确实能够助眠。天王补心丹:有口唇、舌尖都很红,失....
分类:
其他好文 时间:
2014-04-28 15:58:50
阅读次数:
465
时间:4月27日晚上9点地点:信息学院楼组员
4月27日今日完成任务4月28日明天计划任务杨波数据库导入,可以实现简单的查询;连接功能,写个建议界面;周亚豪弄好了界面输出,了解了欢迎界面;完善功能选择界面、查询界面、自习时间安排界面以及欢迎界面;崔海营数据库导入,可以实现简单的查询;将所有教室的数据...
分类:
其他好文 时间:
2014-04-28 15:56:45
阅读次数:
455
1. find find是最常见和最强大的查找命令,你可以用它找到任何你想找的文件。
find的使用格式如下: $ find - : 所要搜索的目录及其所有子目录。默认为当前目录。 - : 所要搜索的文件的特征。 - :
对搜索结果进行特定的处理。 如果什么参数也不加,find...
分类:
其他好文 时间:
2014-04-28 15:33:09
阅读次数:
602
12345678910111213#include void main(){char
*sa="sdhshdh";char *sb="cdehhhhsdssssd";printf("%d , %d
\n",strlen(sa),strlen(sb));if(strlen(sa)-strlen(sb)...
分类:
其他好文 时间:
2014-04-28 15:27:16
阅读次数:
473