码迷,mamicode.com
首页 >  
搜索关键字:spider    ( 1087个结果
[容易]中位数
题目来源:http://www.lintcode.com/zh-cn/problem/median/ C++版 VS2012测试通过 方法一 方法二 Python2.7版 spider测试通过 ...
分类:其他好文   时间:2016-06-27 22:58:26    阅读次数:151
[容易]合并排序数组 II
题目来源:http://www.lintcode.com/zh-cn/problem/merge-sorted-array/ C++版 VS2012测试通过 Python2.7版 spider测试通过 ...
分类:编程语言   时间:2016-06-23 21:57:09    阅读次数:197
C# 爬虫框架实现 概述
目录: 开发目的:写这个程序主要是为了找工作。因为没项目在简历上吃大亏,空口无凭,只能做出点东西证明自己能做事情。 使用: patternlist匹配项定义 定义结果输出方式:本地sqlserver 的spider数据库,或者终端 种子库 需要: 开发使用了开源类:CSQuery解析HTML,所以p ...
分类:Windows程序   时间:2016-06-22 09:20:44    阅读次数:314
中文字体【字蛛】的使用
官网:http://font-spider.org/ 安装字蛛需要先安装node。 先安装好 NodeJS,然后执行: 构建插件:grunt-font-spider | gulp-font-spider 在 CSS 中使用 WebFont: 1. @font-face 中的 src 定义的 .ttf ...
分类:其他好文   时间:2016-06-17 21:14:21    阅读次数:1213
Python学习笔记之Scrapy框架入门
创建一个新的Scrapy项目 定义提取的Item 写一个Spider用来爬行站点,并提取Items 写一个Item Pipeline用来存储提取出的Items 新建工程 在抓取之前,你需要新建一个Scrapy工程。进入一个你想用来保存代码的目录,然后执行:scrapy startproject tu ...
分类:编程语言   时间:2016-06-06 16:46:48    阅读次数:152
httpd之拒绝某些user_agent
user_agent称为浏览器标识,目前主流的浏览器有IE、chrome、Firefox、360、iphone上的Safari、Android手机上的百度搜索引擎、google搜索引擎等很多,每一种浏览器都有对应的user_agent,下面几个user_agent:Mozilla/4.0(compatible;MSIE6.0;WindowsNT5.1;Trident/4.0;.NET4.0C..
分类:Web程序   时间:2016-06-05 17:17:29    阅读次数:678
开源字体包缩减font-spider
最近公司产品用微软雅黑,被告~ 领导要求产品后台系统必须更换字体,美工给了个宋体,个人觉得太丑,就网上搜了些处理方法使用 CSS属性 @font-face 自定义字体, 最后决定用 思源黑体 (思源黑体是Adobe与Google宣布推出的一款开源字体,详细内容自行百度,.ttf文件font-spid ...
分类:其他好文   时间:2016-05-25 16:42:59    阅读次数:674
爬虫:工作中编写的一个python爬取web页面信息的小demo
最近公司要求编写一个爬虫,需要完善后续金融项目的数据,由于工作隐私,就不付被爬的网址url了,下面总结下spider的工作原理。 语言:python;工具:jupyter; (1)使用requests模块,获取url页面。 (2)解析html页面(若是pdf页面需要其他工具模块)需要使用Beauti ...
分类:编程语言   时间:2016-05-16 21:52:54    阅读次数:255
什么是网络爬虫,网络爬虫的职能是什么
网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从 网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网...
分类:其他好文   时间:2016-05-16 12:58:44    阅读次数:306
windows下用py2exe打包脚本为可双击运行程序
文件夹结构: ├── readme.txt ├── settings.py #程序参数 ├── settings.pyc ├── setup.py #安装文件 ├── spider.ico #windows下的程序图标,mac下为.icon └── spider_am.py #主程序 setup.p ...
分类:Windows程序   时间:2016-05-11 17:58:27    阅读次数:221
1087条   上一页 1 ... 89 90 91 92 93 ... 109 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!