网络爬虫的实质,其实是从网络上“偷”数据。通过网络爬虫,我们可以采集到所需要的资源,但是同样,使用不当也可能会引发一些比较严重的问题。 因此,在使用网络爬虫时,我们需要做到“盗亦有道”。 网络爬虫主要分为以下三类: 1. 小规模,数据量小,爬取速度不敏感;对于这类网络爬虫我们可以使用Requests ...
分类:
其他好文 时间:
2017-06-09 15:11:22
阅读次数:
320
webstrom默认不支持wxml文件和wxss文件,所以要进入设置里面手动添加支持。 对wxml文件的支持: 文件 -> 设置 -> 编辑器 -> 文件类型, 然后选择XML文件,然后点击下面的绿色添加按钮,如下图添加通配符设置,点击确认即可,然后点击确定按钮即可配置成功,就可看到webstrom ...
分类:
微信 时间:
2017-06-09 15:11:15
阅读次数:
340
1. 建表 创建MySQL数据表需要以下信息: 表名 表字段名 定义每个表字段 通用语法: 实例: 实例解析: 如果你不想字段为 NULL 可以设置字段的属性为 NOT NULL, 在操作数据库时如果输入该字段的数据为NULL ,就会报错。 AUTO_INCREMENT定义列为自增的属性,一般用于主 ...
分类:
数据库 时间:
2017-06-09 15:11:05
阅读次数:
263
本文转载自:http://www.ha97.com/5194.html 文章经过我排版和润色再加工,更加易读。实在是了解nignx配置的基础好文章。 正文 定义Nginx运行的用户和用户组 user www www; nginx进程数,建议设置为等于CPU总核心数。 worker_processes ...
分类:
其他好文 时间:
2017-06-09 15:10:58
阅读次数:
212
nmon的安装: 1.新建目录nmon:mkdir -p /home/tool/nmon 2.获取nmon安装包,下载地址: http://nmon.sourceforge.net/pmwiki.php?n=Site.Download 需要根据需要来选择,本人使用的是centos,故选择这个安装包: ...
分类:
系统相关 时间:
2017-06-09 15:10:51
阅读次数:
391
1. 在32位系统中定义变量最好用int,因为这样效率高。原因就在于32位的系统本身配合内存等也是32位,这样的硬件配置天生适合定义32位的int类型变量,效率最高。也能定义8位插入型和16位short型变量,但实际上访问效率不高。 2. 在很多32位系统中,我们实际定义了bool类型变量(实际上使 ...
分类:
其他好文 时间:
2017-06-09 15:10:46
阅读次数:
152
Latch 什么是latch: 锁是数据库系统区别与文件系统的一个关键特性。锁机制用于管理对共享资源的并发访问。Innodb存储引擎在行级别上对表数据上锁,这固然不错。但是Innodb也会在多个地方使用锁,从而允许多种不同资源提供并发访问。例如,操作缓冲池汇总的LRU列表,删除、添加、移动LRU列表 ...
分类:
数据库 时间:
2017-06-09 15:10:38
阅读次数:
622
最近开了boost库的学习,就先从日期-时间库开始吧,boost的date_time库是一个很强大的时间库,用起来还是挺方便的。 以下代码只是入门级的简单学习,更详细的资料参考boost源码。 C++ Code 12345678910111213141516171819202122232425262 ...
分类:
其他好文 时间:
2017-06-09 15:10:30
阅读次数:
231
简介 Netstat 命令用于显示各种网络相关信息,如网络连接,路由表,接口状态 (Interface Statistics),masquerade 连接,多播成员 (Multicast Memberships) 等等。 输出信息含义 执行netstat后,其输出结果为 从整体上看,netstat的 ...
分类:
Web程序 时间:
2017-06-09 15:10:21
阅读次数:
213
这个RedisCrawlSpider类爬虫继承了RedisCrawlSpider,能够支持分布式的抓取。因为采用的是crawlSpider,所以需要遵守Rule规则,以及callback不能写parse()方法。 同样也不再有start_urls了,取而代之的是redis_key,scrapy-re ...
分类:
其他好文 时间:
2017-06-09 14:14:17
阅读次数:
310
Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。 HDFS是Google File System(GFS)的开源实现,MapReduce是Google MapReduce的开源实现。 HDFS和MapRed ...
分类:
其他好文 时间:
2017-06-09 14:14:09
阅读次数:
254
目录: 1.获取表格的pageNumber和pageSize 2.获取下拉列表的选中值 3. 1.获取表格的pageNumber和pageSize 2.获取下拉列表的选中值 ...
分类:
其他好文 时间:
2017-06-09 14:14:03
阅读次数:
131
class ViewController: UIViewController { override func viewDidLoad() { super.viewDidLoad() // 标签 let label: UILabel = UILabel(frame: CGRect(x: 100, y: ...
分类:
编程语言 时间:
2017-06-09 14:13:54
阅读次数:
128
/***************************************************************************************************** * @brief: LDC1000应用程序 * _____________ _________ ...
分类:
其他好文 时间:
2017-06-09 14:13:43
阅读次数:
195
要注意的是fragment事实上是有两个版本号的,一个是 import android.support.v4.app.Fragment; 另外一个是 import android.app.Fragment; 这两个版本号的fragment是不会兼容的。也就是说要不就全用fragment,要不就全用v ...
分类:
其他好文 时间:
2017-06-09 14:13:36
阅读次数:
129
在项目根目录下新建main.py文件,用于调试 ...
分类:
其他好文 时间:
2017-06-09 14:13:29
阅读次数:
102
匿名内部类也就是没有名字的内部类 正因为没有名字,所以匿名内部类只能使用一次,它通常用来简化代码编写 但使用匿名内部类还有个前提条件:必须继承一个父类或实现一个接口 实例1:不使用匿名内部类来实现抽象方法 运行结果: eat something 可以看到,我们用Child继承了Person类,然后实 ...
分类:
编程语言 时间:
2017-06-09 14:13:21
阅读次数:
227