码迷,mamicode.com
首页 > 其他好文 > 详细

5.1 便捷数据获取

时间:2018-05-20 21:26:00      阅读:233      评论:0      收藏:0      [点我收藏+]

标签:5.6   相关系数   jid   5.7   idf   分享   title   display   height   

    1.requests 获取

       建立pd矩阵处理数据 pd.DataFrame(),pd.read_csv()

    2.Webapi获取,如豆瓣API

   3.NLTK语料库获取

    技术分享图片

    技术分享图片     技术分享图片


5.4 数据选择

    通过标签或者位置

    djidf.code 或者djidf[‘code’]

    loc 通过标签来选择行或者列

    技术分享图片

     也可以通过djidf.ix[‘a‘]来选择

     技术分享图片

     条件选择

datesdf[(datesdf.index>=‘20180522‘) & (datesdf.index<=‘20180524‘)]
   技术分享图片

5.5 简单统计与处理
    简单处理
技术分享图片
    与前一天比较
    技术分享图片
    相关系数
    技术分享图片
    排序
    技术分享图片
    计数统计
    利用striptime将字符串转为time结构
    技术分享图片

5.6使用grouping
    技术分享图片

5.7 Merge
    datesdf.append(a)
    技术分享图片
    pd.concat([datesdf[:1],datesdf[-1:]])
    技术分享图片
    join
    技术分享图片

5.1 便捷数据获取

标签:5.6   相关系数   jid   5.7   idf   分享   title   display   height   

原文地址:https://www.cnblogs.com/fg2312/p/9064506.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!