参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
1、认识需要配置的环境变量 1). PATH:
作用是指定命令搜索路径,打开/etc/environment可以看到PATH变量的值,该变量包含了一系列的路径。那些路径都是一些经常使用的系统命令的目录地址,如:、/sbin、/bin等。在bash终端执行命令时,系统会自动到PATH变量所指定的路.....
分类:
编程语言 时间:
2014-04-28 16:50:25
阅读次数:
659
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
1. find find是最常见和最强大的查找命令,你可以用它找到任何你想找的文件。
find的使用格式如下: $ find - : 所要搜索的目录及其所有子目录。默认为当前目录。 - : 所要搜索的文件的特征。 - :
对搜索结果进行特定的处理。 如果什么参数也不加,find...
分类:
其他好文 时间:
2014-04-28 15:33:09
阅读次数:
602
这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。
1、获得html文本。 python在获取html方面十分方便,寥.....
分类:
编程语言 时间:
2014-04-28 15:31:09
阅读次数:
712
sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,可以将数据行进行替换、删除、新增、选取等特定工作,下面先了解一下sed的用法sed命令行格式为:sed
[-nefri] ‘command’ 输入文本常用选项:-n∶使用安静(silent)模式。在一般 sed 的用法中,...
分类:
系统相关 时间:
2014-04-28 15:25:18
阅读次数:
578
一、NFS的配置
NFS主要用于Libera系统的软件安装,数据存储等。通常NFS安装于一台Linux
PC机上,在Libera的嵌入式系统上挂载该远程文件系统,可以方便的为Libera安装和更新软件,以及导出采集到的数据。1、Ubuntu默认没有nfs服务,需要自己安装nfs服务
$sudo a....
分类:
其他好文 时间:
2014-04-28 15:05:37
阅读次数:
484
目录(?)[-]基本原理写 framebuffer 驱动程序要做什么LCD 模块 驱动程序
控制器什么是 frame buffer 设备Linux Frame Buffer 驱动程序层次结构数据结构接口一个 LCD controller
驱动程序分配系统内存作为显存实现 fb_ops 结构基本原理通...
分类:
系统相关 时间:
2014-04-27 23:41:53
阅读次数:
827
3. BMP和JPEG图形显示程序3.1
在LCD上显示BMP或JPEG图片的主流程图首先,在程序开始前。要在nfs/dev目录下创建LCD的设备结点,设备名fb0,设备类型为字符设备,主设备号为29,次设备号为0。命令如下:mknod
fb0 c 29 0在LCD上显示图象的主流程图如图3.1所示...
分类:
系统相关 时间:
2014-04-27 23:36:01
阅读次数:
747
framebuffer简介
帧缓冲(framebuffer)是Linux为显示设备提供的一个接口,把显存抽象后的一种设备,他允许上层应用程序在图形模式下直接对显示缓冲区进行读写操作。framebuffer是LCD对应的一中HAL(硬件抽象层),提供抽象的,统一的接口操作,用户不必关心硬件层是怎么实....
分类:
系统相关 时间:
2014-04-27 23:18:13
阅读次数:
915