requests, Beautifusoup 爬取新浪新闻资讯

时间：2017-10-05 14:37:25 阅读：171 评论：0 收藏：0 [点我收藏+]

标签：新浪 port request new 爬取 sele pre http href

import requests
from bs4 import BeautifulSoup

res = requests.get(‘http://news.sina.com.cn/china‘)
res.encoding = ‘utf-8‘
soup = BeautifulSoup(res.text, ‘html.parser‘)

for news in soup.select(‘.news-item‘):
    if len(news.select(‘h2‘)) > 0:
        h2 = news.select(‘h2‘)[0].text
        time = news.select(‘.time‘)[0].text
        a = news.select(‘a‘)[0][‘href‘]
        print(time, h2, a)

标签：新浪 port request new 爬取 sele pre http href

原文地址：http://www.cnblogs.com/minorblog/p/7629125.html

踩

(0)

评论一句话评论（0）