JAVA平台上的网络爬虫脚本语言 CrawlScript网络爬虫即自动获取网页信息的一种程序,有很多JAVA、C++的网络爬虫类库,但是在这些类库的基础上开发十分繁琐,需要大量的代码才可以完成一 个简单 的操作。鉴于这个问题,我们开发了CrawlScript这种脚本语言,程序员只需要写2-3行简单的...
分类:
编程语言 时间:
2015-08-11 07:11:36
阅读次数:
194
TCP协议对应于传输层,而HTTP协议对应于应用层,从本质上来说,二者没有可比性。Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求。Http会通过TCP建立起一个到服务器的连接通道,当本次请求需要的数据完毕后,Http会立即将TCP连接断开.....
分类:
Web程序 时间:
2015-08-10 17:59:59
阅读次数:
112
Js代码document.body.clientWidth==>BODY对象宽度document.body.clientHeight==>BODY对象高度document.documentElement.clientWidth==>可见区域宽度document.documentElement.cli...
分类:
Web程序 时间:
2015-08-10 11:56:11
阅读次数:
111
主要用到的是MSAA(Microsoft Active Accessibility) 函数:ObjectFromLResult,该函数在动态链接库 oleacc.dll 中定义。uses SHDocVw, MsHtml, ActiveX;type TObjectFromLResult = funct...
分类:
Windows程序 时间:
2015-08-09 22:06:48
阅读次数:
2982
PHP实现#测试网址: http://localhost/blog/testurl.php?id=5//获取域名或主机地址 echo $_SERVER['HTTP_HOST'].""; #localhost//获取网页地址 echo $_SERVER['PHP_SELF'].""; #/bl...
分类:
Web程序 时间:
2015-08-06 12:48:39
阅读次数:
121
概述
配置授权回调域名
获取code
获取网页授权的access_token
代码说明概述原文链接:http://blog.csdn.net/u011506468/article/details/47301501
公众号 SuperLishun,想要源码的可以关注公众号,给我留言。
微信参考:http://mp.weixin.qq.com/wiki/17/c0f37d5704f0b64713d...
分类:
微信 时间:
2015-08-06 00:38:51
阅读次数:
13702
# -*- coding: utf-8 -*-import urllib.requestimport reurl='http://s.weibo.com/weibo/%25E9%25BE%2599%25E9%25BA%2592&Refer=STopic_box'urlfile=urllib.requ...
分类:
编程语言 时间:
2015-08-02 00:49:26
阅读次数:
186
Python简单的爬虫最简单的爬虫# -*- coding : utf-8 -*-
import urlliburl = 'http://www.baidu.com'html = urllib.urlopen(url)print html.read()也可以打印出网页的其他信息#获取状态码
print html.getcode()#获取传入的参数
print html.geturl()#获取网页的h...
分类:
编程语言 时间:
2015-08-01 22:05:27
阅读次数:
144
方法一、
function print(){
var a=myform.name.value;
alert(a);
}
这是获取网页input值的方法之一,给from一个名字然后在JavaScript的地方就可以用f...
分类:
Web程序 时间:
2015-07-28 13:04:25
阅读次数:
123
我的数据通过一个TextBox输入,这些代码是写在一个button的点击事件里的。 网页数据抓取大概分为两步,第一步是获取网页源代码: 具体注释如下: var currentUrl = TextBox1.Text;//获得要抓取的网页的URL地址 var request = WebRequest.C...
分类:
Web程序 时间:
2015-07-21 14:35:13
阅读次数:
107