码迷,mamicode.com
首页 > 其他好文 > 详细

爬取今日新闻网的侧边栏

时间:2019-11-23 21:48:50      阅读:55      评论:0      收藏:0      [点我收藏+]

标签:标准   csv   ima   rom   image   ext   import   bsp   文件的   

题目:爬取今日头条新闻网的左边侧栏,并且以csv为文件的形式保存

代码:

import io
import sys
import urllib.request
import pandas as pd
from pyquery import PyQuery as pq
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=gb18030) #改变标准输出的默认编码
url = https://mini.eastday.com/jrdftt/
def get_Info(url):
    res=urllib.request.urlopen(url)
    htmlBytes=res.read()
    doc = pq(htmlBytes.decode(utf-8))
    res = doc(".channel-item span")
    t = [i.text for i in res]
    se = pd.Series(t)
    se.to_csv("列表.csv")

结果:

技术图片

 

 

爬取今日新闻网的侧边栏

标签:标准   csv   ima   rom   image   ext   import   bsp   文件的   

原文地址:https://www.cnblogs.com/CJR-QYF/p/11919559.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!