码迷,mamicode.com
首页 > Web开发 > 详细

urllib库:分析Robots协议

时间:2019-01-07 01:43:00      阅读:154      评论:0      收藏:0      [点我收藏+]

标签:tput   parser   size   parse   str   color   word   url   uri   

 1from urllib.robotparser import RobotFileParser
2import ssl
3from urllib.request import urlopen
4ssl._create_default_https_context = ssl._create_unverified_context
5
6rp = RobotFileParser()
7rp.set_url(‘http://www.jianshu.com/robots.txt‘)
8rp.read()
9print(rp.can_fetch(‘*‘‘http://www.jianshu.com/p/b6755402d7d‘))
10print(rp.can_fetch(‘*‘‘http://www.jianshu.com/search?q=python&page=1&type=note‘))

parse()读取分析

1rp = RobotFileParser()
2rp.parse(urlopen(‘http://www.jianshu.com/robots.txt‘).read().decode(‘utf-8‘).split(‘\n‘))

`

urllib库:分析Robots协议

标签:tput   parser   size   parse   str   color   word   url   uri   

原文地址:https://www.cnblogs.com/gxj521test/p/10206559.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!