码迷,mamicode.com
首页 > 其他好文 > 详细

pandas_数据读取

时间:2020-07-03 23:07:50      阅读:81      评论:0      收藏:0      [点我收藏+]

标签:val   float   trie   int   nbsp   内存   The   types   har   

df = pd.read_excel(‘titanic.xlsx‘,nrows=111,dtype={‘价格‘:np.float},skiprows=13,index_col=0)
nrows:选取前面多少条
dtype:改变某一列类型
skiprows:跳过前面多少行
index_col:将第一列设置位索引列
如心南湾海景酒店(L‘hotel Island South)休闲度假香港南区香港仔黄竹坑道55号4.49573447
12        
13 香港朗廷酒店(The Langham Hong Kong) 休闲度假 香港 油尖旺 尖沙嘴北京道8号 4.7 11039 1899
14 迪士尼探索家度假酒店(Disney Explorers Lodge) 海滨风光 香港 离岛 迪士尼乐园度假区 4.8 4794 1662
15 香港港丽酒店(Conrad Hong Kong) 海滨风光 香港 中西区 金钟 金钟道88号太古广场 4.7 2392 2490
16 香港美丽华酒店(The Mira Hong Kong) 休闲度假 香港 九龙城 尖沙咀弥敦道118-130号美丽华广场 4.6 5882 1583
17 香港悦来酒店(Panda Hotel) 休闲度假 香港 荃湾 荃湾 荃华街3号 4.5 13694 358
... ... ... ... ... ... ... ... ...
119 香港如心铜锣湾海景酒店(L‘hotel Causeway Bay Harbour View ... 海滨风光 香港 东区 铜锣湾 英皇道18号 4.6 9712 678
120 香港港岛太平洋酒店(Island Pacific Hotel) 海滨风光 香港 中西区 西环 干诺道西152号 4.6 4552 594
121 香港基督教青年会酒店(The Salisbury YMCA of Hong Kong) 海滨风光 香港 油尖旺 尖沙嘴 梳士巴利道41号 4.7 3461 1008
122 香港逸兰精品酒店(Lanson Place Hotel) 浪漫情侣 香港 湾仔 铜锣湾礼顿道133号 4.7 2053 1349
123 香港九龙海湾酒店(Kowloon Harbourfront Hotel) 海滨风光 香港 油尖旺 九龙红磡红鸾道8号D座 4.6 5620 770
#打印数据基本信息(样本规模、每列特征类型、整的内存占用)
1:df.info()<class ‘pandas.core.frame.DataFrame‘>
Int64Index: 111 entries, 13 to 123
Data columns (total 8 columns):
 #   Column                          Non-Null Count  Dtype  
---  ------                          --------------  -----  
 0   如心南湾海景酒店(L‘hotel Island South)  111 non-null    object 
 1   休闲度假                            111 non-null    object 
 2   香港                              111 non-null    object 
 3   南区                              111 non-null    object 
 4   香港仔黄竹坑道55号                      111 non-null    object 
 5   4.4                             111 non-null    float64
 6   9573                            111 non-null    int64  
 7   447                             111 non-null    int64  
dtypes: float64(1), int64(2), object(5)
memory usage: 7.8+ KB
#返回索引
2:df.index
#返回每一列的特征名字
3:df.columns
#返回每一列的类型
4:df.dtypes
#数据矩阵
5:df.values
array([[‘香港朗廷酒店(The Langham Hong Kong)‘, ‘休闲度假‘, ‘香港‘, ‘油尖旺‘, ‘尖沙嘴北京道8号‘,
        4.7, 11039, 1899],
       [‘迪士尼探索家度假酒店(Disney Explorers Lodge)‘, ‘海滨风光‘, ‘香港‘, ‘离岛‘,
        ‘迪士尼乐园度假区‘, 4.8, 4794, 1662],
       [‘香港港丽酒店(Conrad Hong Kong)‘, ‘海滨风光‘, ‘香港‘, ‘中西区‘, ‘金钟 金钟道88号太古广场‘]])

 

pandas_数据读取

标签:val   float   trie   int   nbsp   内存   The   types   har   

原文地址:https://www.cnblogs.com/jiaxinHuang/p/13232873.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!