1.概述 有时,我们需要浏览器处理网页,但并不需要浏览,比如生成网页的截图、抓取网页数据等操作。PhantomJS的功能,就是提供一个浏览器环境的命令行接口,你可以把它看作一个“虚拟浏览器”,除了不能浏览,其他与正常浏览器一样。它的内核是WebKit引擎,不提供图形界面,只能在命令行下使用,我们可以 ...
分类:
Web程序 时间:
2017-11-20 01:18:18
阅读次数:
263
在C#编写代码,很多时候会遇到Http协议或者TCP协议,这里做一个简单的理解。TCP协议对应于传输层,而HTTP协议对应于应用层,从本质上来说,二者没有可比性。Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求。Http会通过TCP建立起一个到... ...
分类:
Web程序 时间:
2017-11-04 11:15:08
阅读次数:
179
记录一次快速实现的python爬虫,想要抓取中财网数据引擎的新三板板块下面所有股票的公司档案,网址为http://data.cfi.cn/data_ndkA0A1934A1935A1986A1995.html。 比较简单的网站不同的页码的链接也不同,可以通过观察链接的变化找出规律,然后生成全部页码对 ...
分类:
Web程序 时间:
2017-10-30 17:07:36
阅读次数:
256
java项目有时候我们需要别人网页上的数据,怎么办?我们可以借助第三方架包jsou来实现,jsoup的中文文档,那怎么具体的实现呢?那就跟我一步一步来吧 最先肯定是要准备好这个第三方架包啦,下载地址,得到这个jar后在需要怎么做呢?别急,我们慢慢来 将jsoup.jar拷贝到项目的WebRoot—> ...
分类:
Web程序 时间:
2017-10-13 19:04:01
阅读次数:
203
css概述 CSS是Cascading Style Sheets的简称,中文称为层叠样式表,用来控制网页数据的表现,可以使网页的表现与数据内容分离。 一 css的四种引入方式 1.行内式 行内式是在标记的style属性中设定CSS样式。这种方式没有体现出CSS的优势,不推荐使用。 2.嵌入式 嵌入式 ...
分类:
Web程序 时间:
2017-10-11 20:37:15
阅读次数:
173
未实现定时刷新
Sub抓取股票价格()
OnErrorResumeNext
Setregx=CreateObject("vbscript.regexp")‘
regx.Global=True
regx.Pattern="\[""(.*)"",""(.*)"",(\d+),(.*),(.*),(\d{8}).*\]"‘
arr_stock=Range(Cells(2,1),Cells(Cells(Rows.Count,1).End(xlUp).Row,1))‘股票代码数..
分类:
编程语言 时间:
2017-10-07 21:22:47
阅读次数:
324
VBA从天涯论坛的帖子中提取正文Sub天涯贴子简单抓取()
DimcntAsInteger
arr=Array("评论","举报","楼主","作者","草稿","热贴","论坛","注册","广告","推荐")‘屏蔽词汇
Fory=1To2
Setie=CreateObject("internetexplorer.application")
Withie
.Navigate"http://bbs.tianya.c..
分类:
其他好文 时间:
2017-10-07 14:36:29
阅读次数:
118
在C#编写代码,很多时候会遇到Http协议或者TCP协议,这里做一个简单的理解。TCP协议对应于传输层,而HTTP协议对应于应用层,从本质上来说,二者没有可比性。Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求。Http会通过TCP建立起一个到 ...
分类:
Web程序 时间:
2017-10-03 15:55:56
阅读次数:
190
下面是源代码,第一把爬取的数据保存在CSV,保存的过程中遇到钟种坑,不过还好弄好了,写入csv是要特别注意数据流写入的编码格式,window下所有文件默认都是gbk编码的,所以如果你的网页数据编码格式是utf-8的,那你就要注意了,在写入时加上encoding='utf-8',这次的代码写得好虐心, ...
分类:
其他好文 时间:
2017-09-23 20:13:25
阅读次数:
412
1、在浏览器中输入www.baidu.com 这意味着浏览器要向百度发送一个网页数据包,要发送数据包,需要知道对方的IP地址,这里我们只知道网址为www.baidu.com,却不知道IP地址,此时应用层协议DNS协议会帮我们把网址解析为IP地址,此时会发送一个DNS数据包给DNS服务器,DNS服务器 ...
分类:
其他好文 时间:
2017-09-05 15:46:09
阅读次数:
554