一、CSS概述 CSS是层叠样式表,用来控制网页数据的表现,可以使网页的表现与数据内容分离。 二、引入方式 CSS一共有四种引入方式: 三、CSS选择器 CSS分为四种基本选择器: 基础选择器: 组合选择器: 属性选择器: 伪类:用来给选择器添加一些特殊效果。 四、CSS优先级 所谓CSS优先级,即 ...
分类:
Web程序 时间:
2019-10-09 23:57:49
阅读次数:
185
以梨视频为例分析页面请求抓取网页数据。本次抓取梨视频生活分类页面下的部分视频数据,并保存到本地。 一、分析网页 打开抓取网页,查看网页代码结构,发现网页结构里面存放视频的地址并不是真正的视频地址。 进入视频详情页面查看后,可以在response中找到真正的视频地址。保存这个地址的并不是标签,而是一个 ...
分类:
系统相关 时间:
2019-09-30 22:05:45
阅读次数:
119
一、HTTP接口 Http协议是建立在TCP协议基础之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求。Http会通过TCP建立起一个到服务器的连接通道,当本次请求需要的数据完毕后,Http会立即将TCP连接断开,这个过程是很短的。所以Http连接是一种短连接,是一种无状态的连接 ...
分类:
Web程序 时间:
2019-09-30 16:27:07
阅读次数:
121
Python爬虫工程师必学 App数据抓取实战 爬虫分为几大方向,WEB网页数据抓取、APP数据抓取、软件系统数据抓取。主要讲解如何用python实现App数据抓取 数据去重又称重复数据删除,是指在一个数字文件集合中,找出重复的数据并将其删除,只保存唯一的数据单元。数据去重可以有效避免资源的浪费,所 ...
分类:
移动开发 时间:
2019-09-28 14:34:49
阅读次数:
294
之前没学过Python,最近因一些个人需求,需要写个小爬虫,于是就搜罗了一批资料,看了一些别人写的代码,现在记录一下学习时爬过的坑。 如果您是从没有接触过Python的新手,又想迅速用Python写出一个爬虫,那么这篇文章比较适合你。 首先,我通过: https://mp.weixin.qq.com ...
分类:
编程语言 时间:
2019-09-08 10:06:48
阅读次数:
256
一般成熟的网站都会有反爬虫策略,例如限制访问次数,限制访问 IP,动态显示数据等。爬虫和反爬虫就是一直相爱相杀地互相钳制。如果要通过爬虫来获取某些大型网站的数据,那是一件很费时费力的活。小白总遭遇过在趟过各种坑之前就被封 IP 或封账号的打击(呜呜~说的就是我)。 不过有一些公司心怀开放互联的态度, ...
提交数据和获得数据的方式有很多,这里介绍一种,使用HttpURLConnection来向服务器提交数据或者获得数据。 获得数据: //传入网址,获得请求网页数据(XML文件数据或JSON文件数据) public static String sendHttpRequest(String address ...
分类:
Web程序 时间:
2019-08-19 21:28:36
阅读次数:
116
1、解析XML:使用Pull方式。 需要导入jar包:xmlpull-xpp3-1.1.4c.jar //Pull解析XML文件 private void parseXMLWithPull(String xml_data) { try { XmlPullParserFactory factory = ...
分类:
Web程序 时间:
2019-08-19 20:45:15
阅读次数:
142
css概述 CSS是Cascading Style Sheets的简称,中文称为层叠样式表,用来控制网页数据的表现,可以使网页的表现与数据内容分离。 一 css的四种引入方式 1.行内式 行内式是在标记的style属性中设定CSS样式。这种方式没有体现出CSS的优势,不推荐使用。 2.嵌入式 嵌入式 ...
分类:
Web程序 时间:
2019-08-11 11:11:01
阅读次数:
138
代码如下: 需要确定的三个元素: url: cookeid 和 请求body的格式: 返回参数: ...
分类:
Web程序 时间:
2019-08-07 18:59:31
阅读次数:
117