码迷,mamicode.com
首页 > 编程语言 > 详细

Python:分块读取大文件

时间:2020-06-06 18:28:44      阅读:176      评论:0      收藏:0      [点我收藏+]

标签:ignore   cat   nbsp   data   lin   open   文件   app   mobile   

Python中读取文件的方式有许多种,往往数据量大的情况令人苦恼。之前一篇博客https://www.cnblogs.com/xiaolan-Lin/p/12014686.html我说会发大文件读取的后续。

那么后续来啦!

 1 import pandas as pd
 2 # 采用块读取功能,读取csv文件
 3 path1 = "./data\\tianchi_mobile_recommend_train_user.csv"
 4 
 5 file1 = open(path1)
 6 
 7 user_data = pd.read_csv(path1, sep=,, iterator=True)
 8 
 9 loop = True
10 chunkSize = 1000
11 chunks1 = []
12 while loop:
13     try:
14         chunk1 = user_data.get_chunk(chunkSize)
15         chunks1.append(chunk1)
16     except StopIteration:
17         loop = False
18 user_data = pd.concat(chunks1, ignore_index=True)

 

Python:分块读取大文件

标签:ignore   cat   nbsp   data   lin   open   文件   app   mobile   

原文地址:https://www.cnblogs.com/xiaolan-Lin/p/12262353.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!