标签:python beautifulsoup 爬虫 获取网页里的正文
通过BeautifulSoup库的get_text方法找到网页的正文:
#!/usr/bin/env python #coding=utf-8 #HTML找出正文 import requests from bs4 import BeautifulSoup url=‘http://www.baidu.com‘ html=requests.get(url) soup=BeautifulSoup(html.text) print soup.get_text()
本文出自 “linux与网络那些事” 博客,请务必保留此出处http://khaozi.blog.51cto.com/952782/1793075
标签:python beautifulsoup 爬虫 获取网页里的正文
原文地址:http://khaozi.blog.51cto.com/952782/1793075