码迷,mamicode.com
首页 >  
搜索关键字:网页数据    ( 465个结果
PhantomJS
1.概述 有时,我们需要浏览器处理网页,但并不需要浏览,比如生成网页的截图、抓取网页数据等操作。PhantomJS的功能,就是提供一个浏览器环境的命令行接口,你可以把它看作一个“虚拟浏览器”,除了不能浏览,其他与正常浏览器一样。它的内核是WebKit引擎,不提供图形界面,只能在命令行下使用,我们可以 ...
分类:Web程序   时间:2017-11-20 01:18:18    阅读次数:263
【转载】Http协议与TCP协议简单理解
在C#编写代码,很多时候会遇到Http协议或者TCP协议,这里做一个简单的理解。TCP协议对应于传输层,而HTTP协议对应于应用层,从本质上来说,二者没有可比性。Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求。Http会通过TCP建立起一个到... ...
分类:Web程序   时间:2017-11-04 11:15:08    阅读次数:179
使用selenium webdriver+beautifulsoup+跳转frame,实现模拟点击网页下一页按钮,抓取网页数据
记录一次快速实现的python爬虫,想要抓取中财网数据引擎的新三板板块下面所有股票的公司档案,网址为http://data.cfi.cn/data_ndkA0A1934A1935A1986A1995.html。 比较简单的网站不同的页码的链接也不同,可以通过观察链接的变化找出规律,然后生成全部页码对 ...
分类:Web程序   时间:2017-10-30 17:07:36    阅读次数:256
jsoup抓取网页数据
java项目有时候我们需要别人网页上的数据,怎么办?我们可以借助第三方架包jsou来实现,jsoup的中文文档,那怎么具体的实现呢?那就跟我一步一步来吧 最先肯定是要准备好这个第三方架包啦,下载地址,得到这个jar后在需要怎么做呢?别急,我们慢慢来 将jsoup.jar拷贝到项目的WebRoot—> ...
分类:Web程序   时间:2017-10-13 19:04:01    阅读次数:203
CSS
css概述 CSS是Cascading Style Sheets的简称,中文称为层叠样式表,用来控制网页数据的表现,可以使网页的表现与数据内容分离。 一 css的四种引入方式 1.行内式 行内式是在标记的style属性中设定CSS样式。这种方式没有体现出CSS的优势,不推荐使用。 2.嵌入式 嵌入式 ...
分类:Web程序   时间:2017-10-11 20:37:15    阅读次数:173
VBA 根据股票代码查询价格
未实现定时刷新 Sub抓取股票价格() OnErrorResumeNext Setregx=CreateObject("vbscript.regexp")‘ regx.Global=True regx.Pattern="\[""(.*)"",""(.*)"",(\d+),(.*),(.*),(\d{8}).*\]"‘ arr_stock=Range(Cells(2,1),Cells(Cells(Rows.Count,1).End(xlUp).Row,1))‘股票代码数..
分类:编程语言   时间:2017-10-07 21:22:47    阅读次数:324
天涯社区论坛贴子粗加工
VBA从天涯论坛的帖子中提取正文Sub天涯贴子简单抓取() DimcntAsInteger arr=Array("评论","举报","楼主","作者","草稿","热贴","论坛","注册","广告","推荐")‘屏蔽词汇 Fory=1To2 Setie=CreateObject("internetexplorer.application") Withie .Navigate"http://bbs.tianya.c..
分类:其他好文   时间:2017-10-07 14:36:29    阅读次数:118
Http协议与TCP协议简单理解( 转 )
在C#编写代码,很多时候会遇到Http协议或者TCP协议,这里做一个简单的理解。TCP协议对应于传输层,而HTTP协议对应于应用层,从本质上来说,二者没有可比性。Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求。Http会通过TCP建立起一个到 ...
分类:Web程序   时间:2017-10-03 15:55:56    阅读次数:190
爬取豆瓣中的战狼影评,保存在CSV
下面是源代码,第一把爬取的数据保存在CSV,保存的过程中遇到钟种坑,不过还好弄好了,写入csv是要特别注意数据流写入的编码格式,window下所有文件默认都是gbk编码的,所以如果你的网页数据编码格式是utf-8的,那你就要注意了,在写入时加上encoding='utf-8',这次的代码写得好虐心, ...
分类:其他好文   时间:2017-09-23 20:13:25    阅读次数:412
访问www.baidu.com后会发生什么(一次完整的网络通讯过程)
1、在浏览器中输入www.baidu.com 这意味着浏览器要向百度发送一个网页数据包,要发送数据包,需要知道对方的IP地址,这里我们只知道网址为www.baidu.com,却不知道IP地址,此时应用层协议DNS协议会帮我们把网址解析为IP地址,此时会发送一个DNS数据包给DNS服务器,DNS服务器 ...
分类:其他好文   时间:2017-09-05 15:46:09    阅读次数:554
465条   上一页 1 ... 16 17 18 19 20 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!