1 import pandas as pd 2 3 # 创建一个df 4 df = pd.DataFrame( 5 data={ 6 "name": ["zs", "ls", "ww", "zl"], 7 "age": [18, 19, 29, 11], 8 "score": [92.5, 93, ...
分类:
其他好文 时间:
2019-12-29 20:50:07
阅读次数:
85
一、dataframe的增加操作 1 import pandas as pd 2 3 # 加载数据 4 users = pd.read_excel("./users.xlsx") 5 print("users:\n", users) 6 print("users 的类型:\n", type(user ...
分类:
其他好文 时间:
2019-12-29 20:43:08
阅读次数:
115
多级索引 多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame对象上拥有2个以及2个以上的索引。实质上,单级索引对应Index对象,多级索引对应MultiIndex对象。 一、Series对象的多级索引 多级索引Series对象的创建 import pandas ...
分类:
其他好文 时间:
2019-12-29 13:04:07
阅读次数:
58
什么是总体和样本? 随机数random模块 # 导入 random(随机数) 模块 import random ''' 使用random 模块的 randint() 函数来生成随机数 语法是:random.randint(a,b) 函数返回数字 N , N 为a到b之间的数字(a <= N <= b ...
分类:
其他好文 时间:
2019-12-29 00:43:54
阅读次数:
93
1.matplotlib是一种比较低级的工具,pandas中有许多利用DataFrame对象数据组织特点来创建标准图表的高级绘图方法。 2.Series/DataFrame.plot():绘制图形。 Series.plot(kind='line', ax=None, figsize=None, us ...
分类:
其他好文 时间:
2019-12-27 17:53:02
阅读次数:
72
一、简介 pandas是一个强大的Python数据分析的工具包,它是基于Numpy构建的,正因pandas的出现,让Python语言也成为使用最广泛而且强大的数据分析环境之一。 Pandas的主要功能: 具备对其功能的数据结构DataFrame,Series 集成时间序列功能 提供丰富的数学运算和操 ...
分类:
其他好文 时间:
2019-12-26 21:23:16
阅读次数:
122
1.小平面网格 1.1 FaceGrid 1.2 FacetGrid.map 1.3 FacetGrid.map_dataframe 2.配对网格 2.1 PairGrid 2.2 PairGrid.map 2.3 PairGrid.map_diag 2.4 PairGrid.map_offdiag ...
分类:
其他好文 时间:
2019-12-25 20:31:16
阅读次数:
142
目录 一、Spark SQL介绍 二、Spark和Hive的整合 三、Spark的thriftserve2/beeline/jdbc 四、shell方式使用SQL 一、Spark SQL介绍 官网:http://spark.apache.org/sql/ 学习文档:http://spark.apac ...
分类:
数据库 时间:
2019-12-24 23:44:13
阅读次数:
353
1、通过case class方式创建 people.txt //定义case class,相当于表结构 case class People(var name:String,var age:Int) object TestDataFrame1 { def main(args: Array[String ...
分类:
其他好文 时间:
2019-12-24 17:02:23
阅读次数:
111
背景:将商品id以及商品类别作为字典的键值映射,生成字典,原为DataFrame # 创建一个DataFrame # 列值类型均为int型 import pandas as pd item = pd.DataFrame({'item_id': [100120, 10024504, 1055460], ...
分类:
编程语言 时间:
2019-12-24 15:23:09
阅读次数:
368