gartner定义big data;《大数据时代》;大数据生态应用领域;target一家企业twittertescofacebook 婚嫁后推荐(拍婚纱照的价位,品味推后续生活产品)大数据应用技术 语义网(目的:让计算机读懂文档知识) 知识图谱(给AI装个大脑,基于图数据,是图存储,优势是更清晰) ...
分类:
其他好文 时间:
2020-06-15 11:59:27
阅读次数:
76
一,什么是Http? Http(超文本传输协议)是一个简单的请求—响应协议,它通常运行在TCP之上(TCP : 传输控制协议,Transmission Control Protocol)。 文本:html,字符串, 超文本: 图片,音乐,视频,定位,地图等等 80端口 ,是为HTTP(HyperTe ...
分类:
Web程序 时间:
2020-06-14 16:28:09
阅读次数:
81
首先了解一下什么是爬虫 1.爬虫的定义 爬虫:网络爬虫:(web crawer),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本 2.通过一个简单的实例先进行一个体验,更直观的了解一下爬虫的厉害之处 代码编写的环境: 1.JDK1.8 2.idea 3.maven 下面就是简单爬虫的测试类 ...
分类:
其他好文 时间:
2020-06-13 00:52:01
阅读次数:
61
RESTFUL风格自从被提出来就很火了,尤其是在这个移动互联网爆发的时代...... ...
分类:
其他好文 时间:
2020-06-12 01:12:31
阅读次数:
98
它们本质上都是tcp链接,并无多大差别: HTTP是基于TCP/IP的关于数据如何在万维网中如何通信的协议。 HTTP的底层协议是TCP/IP。 所以GET和POST的底层也是TCP/IP 唯一一个很大的区别在于: GET产生一个TCP数据包;POST产生两个TCP数据包。 对于GET方式的请求,浏 ...
分类:
其他好文 时间:
2020-06-10 21:13:03
阅读次数:
56
一、HTTP概数(专业人士的专业描述,引用一下) HTTP(HyperText Transfer Protocol)即超文本传输协议。这个协议详细规定了浏览器和万维网服务器之间互相通信的规则。 HTTP就是一个通信规则,通信规则规定了客户端发送给服务器的内容格式,也规定了服务器发送给客户端的内容格式 ...
分类:
编程语言 时间:
2020-06-09 23:59:19
阅读次数:
257
概述: 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 一般来说,一个爬虫包括几个部分: 页面下载 页面下载是一个爬虫的基础。下载页面之后才能进 ...
分类:
Web程序 时间:
2020-06-04 21:39:45
阅读次数:
318
by 轩辕御龙 HTTP 入门 HTTP,全称“超文本传输协议(HyperText Transfer Protocol)”,是构建我们今天所熟知的万维网的基础,也是我们在访问互联网时最常见的一种协议类型。 我们在打开一个网页的时候通常都会注意到网址的前面有一个统一的标识“http://”(或“htt ...
分类:
Web程序 时间:
2020-05-31 16:28:40
阅读次数:
134
by 闲欢 作为程序员,相信大家对“爬虫”这个词并不陌生,身边常常会有人提这个词,在不了解它的人眼中,会觉得这个技术很高端很神秘。不用着急,我们的爬虫系列就是带你去揭开它的神秘面纱,探寻它真实的面目。 爬虫是什么 网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的 ...
分类:
其他好文 时间:
2020-05-31 16:16:11
阅读次数:
116
The Web Makes it Easy to Use 万维网的诞生:利用CERN这个拥有世界上最先进的高能物理设施的核子研究中心作为实验基础,以解决“只有知道数据具体存储 位置才能访问、调取数据”这一问题为目的,将顶部浏览器和底层数据库分割,实现了利用链接从一个站点跳到另一个站点,彻底 摆脱了以 ...
分类:
Web程序 时间:
2020-05-31 01:04:11
阅读次数:
114