码迷,mamicode.com
首页 > 其他好文 > 详细

20161124网络爬虫技术学习

时间:2016-11-24 19:16:32      阅读:177      评论:0      收藏:0      [点我收藏+]

标签:组成   参考   过程   universal   访问   抓取   自己   解释   爬虫   

参考书籍:《自己动手写网络爬虫》

网络爬虫的基本操作是抓取网页。

“打开”网页的过程其实就是浏览器作为一个浏览的“客户端”,向服务器端发送了一次请穷求,把服务器端的文件“抓”到本地,再进行解释,展现。更进一步,可以通过浏览器端查看“抓取”过来的文件源代码,

url(Universal Resource Identifier)通用资源标志符

uri通常由三部分组成:1访问资源的命名机制2存放资源的主机名3资源自身的名称

 

20161124网络爬虫技术学习

标签:组成   参考   过程   universal   访问   抓取   自己   解释   爬虫   

原文地址:http://www.cnblogs.com/zero1224/p/6098770.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!