1、安装基本库yum install gccyum install makeyum
install zlib-develyum install bzip2-develyum install openssl-develyum install
ncurses-devel2、获得python2.7.4wg...
分类:
编程语言 时间:
2014-04-30 04:58:42
阅读次数:
400
参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
想写个自动定会议室的程序。1、会议系统登录后,存在session,提交会议室的订单通过httpwatch拼接后获得链接地址,直接访问链接及可以了2、如果没有提前登录,就无法提交链接了。使用python+PAMIE实现了了自动登录的过程(登录的链接一直拼接不出来。。)下面说说这个研究过程。。1、一开始...
分类:
编程语言 时间:
2014-04-28 16:04:47
阅读次数:
848
这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。
1、获得html文本。 python在获取html方面十分方便,寥.....
分类:
编程语言 时间:
2014-04-28 15:31:09
阅读次数:
712
原始DFA如下图所示最小化的定义:1.没有多余的状态(死状态);2.没有两个状态是相互等价的;两个状态等价的含义:1.兼容性(一致性)——同是终态或同是非终态;2.传播性(蔓延性)——从s出发读入某个a和从t出发经过某个a并且经过某个b到达的状态等价。令M为DFA中所有状态的集合。1.开始做粗略划分...
分类:
其他好文 时间:
2014-04-28 14:38:13
阅读次数:
966
sudo apt-get install
python-software-propertiessudo apt-add-repository ppa:brightbox/ruby-ngsudo
apt-get updatesudo apt-get install ruby2.1ruby2.1 -vr...
分类:
其他好文 时间:
2014-04-28 14:18:29
阅读次数:
445
LeetCode:Combinations这篇博客中给出了不包含重复元素求组合的5种解法。我们在这些解法的基础上修改以支持包含重复元素的情况。对于这种情况,首先肯定要对数组排序,以下不再强调修改算法1:按照求包含重复元素集合子集的方法LeetCode:Subsets
II算法1的解释,我们知道:若当...
分类:
其他好文 时间:
2014-04-28 14:00:43
阅读次数:
717
答:泛型是 C# 2.0 开始引入的一种更加灵活、规范的数据操作机制,看例子: class
Student{} 假设有学生对象需要存入集合,再提取出来 ArrayList list = new ArrayList(); //1、实例化 list
集合对象 Student s = new Studen...
分类:
其他好文 时间:
2014-04-28 12:10:06
阅读次数:
520
由于数组具有属性单一,长度不可改变的缺点,于是在程序中我们使用集合来代替它。集合中不可放入基本数据类型,基本数据类型都是通过自动拆包和自动装箱功能才能放入和取出集合。分类:Collection接口和Map接口Collection:存放单一值元素,又可分为list接口类型和set接口类型
...
分类:
编程语言 时间:
2014-04-28 11:20:31
阅读次数:
582
ArrayList:public class ArrayListextends
AbstractListimplements List, RandomAccess, Cloneable, SerializableList
接口的大小可变数组的实现。实现了所有可选列表操作,并允许包括 null 在内的...
分类:
编程语言 时间:
2014-04-28 01:31:46
阅读次数:
834