python BeautifulSoup获取网页正文

时间：2016-06-27 00:12:04 阅读：528 评论：0 收藏：0 [点我收藏+]

通过BeautifulSoup库的get_text方法找到网页的正文：

#!/usr/bin/env python
#coding=utf-8

#HTML找出正文

import requests
from bs4 import BeautifulSoup

url=‘http://www.baidu.com‘
html=requests.get(url)

soup=BeautifulSoup(html.text)
print soup.get_text()

本文出自 “linux与网络那些事” 博客，请务必保留此出处http://khaozi.blog.51cto.com/952782/1793075

标签：python beautifulsoup 爬虫获取网页里的正文

原文地址：http://khaozi.blog.51cto.com/952782/1793075

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行