标签:标识符 互联网 证书 地址栏 理解 客户端 网络协议 认证 安全基础
在学习HTTP之前我们需要了解一下URL、URI(精确的说明某资源的位置以及如果去访问它)
URL:Universal Resource Locator 统一资源定位符,描述了一台特定服务器上某资源的特定位置。
URI :Uniform Resource Identifier 统一资源标识符,URI有两种表现形式URL和URN。
我们经常会在URL的首部会看到http或者https,这个就是访问资源需要的协议类型,除了http和https还有ftp,sftp,smb等。在爬虫中,我们常用的就是http和https。
http:HyperText Transfer Protocol 超文本传输协议是互联网上应用最为广泛的一种网络协议。所有的www文件都要遵守这个标准。HTTP是一个客户端和服务器端请求和应答的标准,它使用socke基于TCP建立的,所以http是可靠的数据传输协议,由于它是短链接的,也就是一次请求,一次响应断开,所以它表现处无状态的现象。目前广泛使用的是 HTTP 1.1 版本。
https : Hyper Text Transfer Protocol over Secure Socket Layer是以安全为目标的 HTTP 通道,简单讲是HTTP的安全版,即 HTTP 下加入 SSL 层,简称为 HTTPS。HTTPS的安全基础是SSL,所以他传输的内容都是经过SSL加密的,它的主要作用:
HTTP和HTTPS的区别:
爬虫基础---HTTP协议理解、网页的基础知识、爬虫的基本原理
标签:标识符 互联网 证书 地址栏 理解 客户端 网络协议 认证 安全基础
原文地址:https://www.cnblogs.com/weihengblog/p/9319967.html