网络爬虫(Web crawler),是一种按照一定的规则,自动的抓取万维网信息的程序或脚本。 1.1 爬虫入门程序 1.2网络爬虫介绍 大数据时代,信息的采集是一项重要的工作,而互联网的数据是海量的,如果单纯靠人力进行信息采集,不仅低效繁琐,搜集的成本也会提高。如何自动高效地获取互联网中我们感兴趣的 ...
分类:
其他好文 时间:
2020-05-30 21:50:07
阅读次数:
123
一、什么是HTML5 1.1 HTML5 简介 万维网的核心语言、标准通用标记语言下的一个应用超文本标记语言(HTML)的第五次重大修改,作为新HTML语言,具有新的元素、属性和行为 XHTML可扩展超文本标记语言 是一种增强了的HTML,它的可扩展性和灵活性将适应未来网络应用更多的需求,基础班学习 ...
分类:
Web程序 时间:
2020-05-30 18:25:28
阅读次数:
109
我们第一次谈论 HTML5 要改变世界大概是因为乔布斯,他坚持在 iOS 上不兼容 Flash,在 Adobe 统治多媒体开发的那个年代,这需要付出极大的勇气。这么多年过去了,虽然所有人都在谈论 HTML5,但是大部分人甚至都忘了它还是一个仍在完善中的体系。 2007 年 W3C(万维网联盟)立项 ...
分类:
Web程序 时间:
2020-05-28 19:35:39
阅读次数:
131
HTTP协议 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于万维网(WWW:World Wide Web )服务器与本地浏览器之间传输超文本的传送协议。 HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系 ...
分类:
Web程序 时间:
2020-05-28 19:31:54
阅读次数:
178
什么是 XML ? XML 指可扩展标记语言(eXtensible Markup Language)。 可扩展标记语言,标准通用标记语言的子集,一种用于标记电子文件使其具有结构性的标记语言。 它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提 ...
分类:
其他好文 时间:
2020-05-23 18:43:44
阅读次数:
50
到了JavaScript中最重要的部分,DOM对象,基本就是怎么找到对应的标签,然后给他加上各种酷炫的效果。 DOM对象(DHTML) 1.什么是 DOM? DOM 是 W3C(万维网联盟)的标准。DOM 定义了访问 HTML 和 XML 文档的标准: "W3C 文档对象模型(DOM)是中立于平台和 ...
分类:
编程语言 时间:
2020-05-20 00:20:46
阅读次数:
80
网络爬虫 一.基本概念 一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 1.1 网络爬虫分类 网络爬虫按照系统结构和实现技术,大致可以分为以下几种类型:通用网络爬虫(General Purpose Web Crawler)、聚焦网络爬虫(Focused Web Crawler)、增量式网络 ...
分类:
编程语言 时间:
2020-05-17 19:09:00
阅读次数:
100
1 共同点: 2 GET和POST是HTTP协议中的两种发送请求的方法。 3 HTTP是基于TCP/IP的关于数据如何在万维网中如何通信的协议。 4 GET和POST本质上就是TCP链接,并无差别。 不同点:1. GET在浏览器回退时是无害的,而POST会再次提交请求。 2. GET请求会被浏览器主 ...
分类:
其他好文 时间:
2020-05-16 10:37:33
阅读次数:
101
先将服务器配置一个固定ip 右键网上邻居--属性 右键本地连接,属性 点击Internet协议 然后将此虚拟机设置为桥接模式 打开我的电脑,找到当初安装win2003镜像时的CD,点开 找到安装可选的windows组件,点开 找到应用程序服务器,点开 找到Internet信息服务,点开 勾选万维网服 ...
万维网概述 超文本传输协议HTTP HTTP协议的特点 HTTP协议的连接方式 HTTP报文结构 END ...
分类:
Web程序 时间:
2020-05-14 01:10:07
阅读次数:
103