0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( ...
分类:
其他好文 时间:
2018-03-29 22:30:45
阅读次数:
99
0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( ...
分类:
其他好文 时间:
2018-03-29 21:26:00
阅读次数:
172
0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( ...
分类:
其他好文 时间:
2018-03-29 21:25:32
阅读次数:
151
取出h1标签的文本 取出a标签的链接 取出所有li标签的所有内容 取出一条新闻的标题、链接、发布时间、来源 ...
分类:
其他好文 时间:
2018-03-29 21:20:35
阅读次数:
159
0.可以新建一个用于练习的html文件,在浏览器中打开。 1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get( ...
分类:
其他好文 时间:
2018-03-29 21:16:15
阅读次数:
110
1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(newsurl) #返回response对象 res.en ...
分类:
其他好文 时间:
2018-03-29 21:14:20
阅读次数:
129
0.可以新建一个用于练习的html文件,在浏览器中打开。 上课时老师所给的html文件,便于数据爬虫。 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>GZCC新闻网</title> </head> <bod ...
分类:
其他好文 时间:
2018-03-29 20:07:49
阅读次数:
234
import requests newsurl = 'http://localhost:63342/bd/aaa.html?_ijt=7pd1hi6n7j1ue90de4jivbr31k' res = requests.get(newsurl) # 返回response对象 res.encoding... ...
分类:
其他好文 时间:
2018-03-29 20:06:40
阅读次数:
181
0.可以新建一个用于练习的html文件,在浏览器中打开。 329.html 1.利用requests.get(url)获取网页页面的html文件 2.利用BeautifulSoup的HTML解析器,生成结构树 3.找出特定标签的html元素 4.取得含有特定CSS属性的元素 5.练习: 取出h1标签 ...
分类:
其他好文 时间:
2018-03-29 20:03:24
阅读次数:
145
1.利用requests.get(url)获取网页页面的html文件 import requests newsurl='http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(newsurl) #返回response对象 res.en ...
分类:
其他好文 时间:
2018-03-29 20:02:27
阅读次数:
127