import java.io.BufferedReader;import java.io.InputStreamReader;import java.net.HttpURLConnection;import java.net.URL;import java.util.regex.Matcher;im...
分类:
编程语言 时间:
2015-11-24 16:12:30
阅读次数:
249
import java.io.BufferedReader;import java.io.InputStreamReader;import java.net.HttpURLConnection;import java.net.URL;public class HttpTest { String ur...
分类:
编程语言 时间:
2015-11-22 15:53:57
阅读次数:
195
document.body.scrollTop与document.documentElement.scrollTop两者有个特点,就是同时只会有一个值生效。比如document.body.scrollTop能取到值的时候,document.documentElement.scrollTop就会始终为...
分类:
Web程序 时间:
2015-11-16 19:43:06
阅读次数:
289
nodejs获取网页内容绑定data事件,获取到的数据会分几次相应,如果想全局内容匹配,需要等待请求结束,在end结束事件里把累积起来的全局数据进行操作!举个例子,比如要在页面中找有没有www.baidu.com,不多说了,直接放代码://引入模块var http = require("http")...
分类:
Web程序 时间:
2015-11-16 15:35:25
阅读次数:
151
#include?<stdio.h>
#include?<winsock2.h>
#include?<string.h>
#pragma?comment(lib,?"ws2_32.lib")
void?geturl(char?*url)
{
????WSADATA?WSAData={0};
????SOCKET?sockfd;
????struc...
分类:
Web程序 时间:
2015-11-16 06:14:01
阅读次数:
184
Jsoup.parse解析HTML字符串,如Jsoup.parse("Firstparse")Jsoup.connect解析url网站地址,如Jsoup.connect(http://www.baidu.com).get()可以用httpclient获取网页,再用Jsoup.parse解析页面Str...
分类:
Web程序 时间:
2015-11-10 17:34:50
阅读次数:
288
因采集需求,想解决网页编码识别问题。网上提出了很多方法。比如根据文件头字节判断,或根据网页的charset标识符判断。我在实际应用中,这些方法都有各自的不足,比如有的网页charset写的是gbk,但实际是utf8。于是想了一个个人认为比较新鲜的方法。将html下载回来后,做一份utf8副本和一份g...
①、WinINet与WinHttp的异同点,为什么使用WinHttp讲解?详情见:《WinINet与WinHttp总结》文档,已经打包给大家了。②、WinHttp接口调用方式:微软官方地址:http://msdn.microsoft.com/en-us/ ... 84263(v=vs.85).asp...
分类:
Windows程序 时间:
2015-11-01 00:20:59
阅读次数:
1393
document.body.clientWidth ==> BODY对象宽度document.body.clientHeight ==> BODY对象高度document.documentElement.clientWidth ==> 可见区域宽度document.documentElement.c...
分类:
Web程序 时间:
2015-10-30 14:19:02
阅读次数:
237
36大数据专稿,本文由36大数据收集整理,转载必须标明来源36大数据且附上本文连接。http://www.36dsj.com/archives/34383要玩大数据,没有数据怎么玩?这里推荐一些33款开源爬虫软件给大家。爬虫,即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜...
分类:
其他好文 时间:
2015-10-30 07:05:14
阅读次数:
302