urllib最常用的两大功能(个人理解urllib用于辅助urllib2) 1.urllib.urlopen() 2. urllib.urlencode() #适当的编码,可用于后面的post提交数据 urllib2常用的函数 1.最基本的打开读取一个网页 2.地址创建一个Request对象 3.D ...
分类:
Web程序 时间:
2016-05-18 01:35:29
阅读次数:
247
闲着无聊就想鼓捣点东西玩玩,所以决定用node做个爬虫来爬点数据。查了些资料鼓捣了一段时间也算是弄出了个简单的爬虫。 目前这只小爬虫还是有不少缺陷,不过爬点简单的静态页面上的内容已经足够了。 详细的使用说明我就不介绍了,在github中有。地址:https://github.com/XLandMin ...
分类:
Web程序 时间:
2016-04-28 16:59:27
阅读次数:
178
这个java小爬虫, 功能很简单,只有一个,抓取网上的邮箱。用到了javaI/O,正则表达式。 output:xinwenge@vip.qq.com 哈哈,爬的腾讯新闻里面的一个网页。 ...
分类:
编程语言 时间:
2016-04-17 14:37:32
阅读次数:
185
本篇文章将教大家如何在python2中安装httplib2库,并且会通过一个小爬虫实例展示一下其功能。首先大家可以从“https://code.google.com/p/httplib2/”下载一款适合你的压缩包(也可以从本篇文章的附件中直接下载lib2安装包)解压你的压缩包到任意目录中(推荐是python的安装目..
分类:
编程语言 时间:
2016-04-07 18:41:08
阅读次数:
1058
HTTP源码解读 HTTP性能测试 HTTP小爬虫 //安装cheerionpm install cheerio /**********************************/ /**********************************/ ...
分类:
Web程序 时间:
2016-04-05 12:26:44
阅读次数:
278
最近遇到一个需求,就是要从一个英语句子分析的页面中,根据你输入的英语从句,点击开始分析按钮,这个页面就会将分析的结果解析出来,如 然后我们就是需要从这个页面中把这些解析好的数据(包括句子语法结构详解,句子相关词汇解释等)取出来,这时候我就想到之前学过node.js,这时候就来弄下node.js的小小 ...
分类:
Web程序 时间:
2016-03-27 19:42:25
阅读次数:
155
使用JavaScript在前端访问跨域页面常常用到Ajax,后端Node.js抓取网页信息就容易得多。 下面是一个最简单的例子,抓取我的博客主页信息,显示首页博客标题。 21行指定一个url资源发起get请求,回调函数处理响应对象response,response返回的是HTML文档。 对DOM处理 ...
分类:
Web程序 时间:
2016-03-26 14:05:51
阅读次数:
244
热点随笔: · 这几天,心情起伏有点大(小蚊)· 放养的小爬虫--京东定向爬虫(AJAX获取价格数据)(Erma_Jack)· 见证花开!!码上有花(上位者的怜悯)· 【深入浅出jQuery】源码浅析--整体架构(ChokCoco)· 大流量网站性能优化:一步一步打造一个适合自己的BigRender
分类:
其他好文 时间:
2016-03-21 08:11:12
阅读次数:
159
最近开始找工作,本人苏州,面了几家都没有结果很是伤心。在拉勾上按照城市苏州关键字.NET来搜索一共才80来个职位,再用薪水一过滤,基本上没几个能投了。再加上最近苏州的房价蹭蹭的长,房贷压力也是非常大,所以有点想往上海去发展。闲来无聊写了个小爬虫,爬了下苏州跟上海的.NET职位的信息,然后简单对比了一
分类:
Web程序 时间:
2016-03-11 06:24:53
阅读次数:
277
转自:http://cuiqingcai.com/1052.html 大家好哈,我呢最近在学习Python爬虫,感觉非常有意思,真的让生活可以方便很多。学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫,在这里跟大家一同分享,希望对Python爬虫感兴趣的童鞋有帮助,如果有机会
分类:
编程语言 时间:
2016-02-29 21:34:01
阅读次数:
146