1.Pandas读取数据 out: 使用read_csv()函数时,可能会报错如上。 显示以上错误,网上解答说可能是路径含有中文名,或者只能读取当前文件夹下的文件; 设置:engine=“python”解决问题!! 默认engine=“C”,使用C时速度较快,但是包含中文时出错。 In: Out: ...
分类:
其他好文 时间:
2018-07-06 19:42:14
阅读次数:
171
1.算术运算 DataFrame.add/sub/mul/div 2.统计 DataFrame.sum/mode/median... describe 简单数据表的信息(max、min、count、mean等等) 3.协方差和相关系数 cov corr ...
分类:
其他好文 时间:
2018-07-05 14:51:19
阅读次数:
190
1.丢弃指定轴上的数据 删除第二列 2.函数映射 Numpy的ufunc也可以用于操作pandas对象。 例如:np.fabs(frame) DataFrame.apply DataFrame.apply(func, axis=0, broadcast=None, raw=False, reduce ...
分类:
其他好文 时间:
2018-07-05 13:56:23
阅读次数:
170
7. 数据源 Spark-SQL 支持通过Dataframe接口对各种数据源进行操作 各种数据源的加载&保存 数据转换(relational transformations) 注册临时视图(temporary view),来允许SQL的形式直接对临时视图进行操作 7.1 数据源加载 Spark-SQ ...
分类:
其他好文 时间:
2018-07-05 01:24:13
阅读次数:
495
pandas:是一个数据分析的类库 dataframe数据读入 read_json html csv excel sql 数据写出 to_json html csv excel sql 数据结构 第一个 series :是一个一维的ndarray , 带有标签 可以通过标签作为索引 尺度不能改变,里 ...
分类:
其他好文 时间:
2018-07-03 14:59:29
阅读次数:
154
Pandas处理以下三个数据结构 - 系列(Series) 一维ndarray 特点:带有标签,可以使用标签作为索引,大小不能改变,内部数据可以改变。 属性:与NumPy类似,多了一个轴标签axis lables 数据帧(DataFrame) 二维ndarray 特点:带标签,可以同行列标签索引,尺 ...
分类:
其他好文 时间:
2018-07-02 22:10:40
阅读次数:
220
pandas DataFrame是一个表格类型的数据,含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值)。DataFrame即有行索引,也有列索引,可以看作由Series组成的字典(公用同一个索引)。 DataFrame是以一个或者多个二维块存放的(而不是列表,字典或别的一维数据结构) ...
分类:
其他好文 时间:
2018-07-01 23:01:39
阅读次数:
132
pandas DataFrame是二维的,所以,它既有列索引,又有行索引 上一篇里只介绍了列索引: 行索引自动生成了 0,1,2 如果要自己指定行索引和列索引,可以使用 index 和 column 参数: 这个数据是5个车站10天内的客流数据: data 参数为一个numpy二维数组, index ...
分类:
其他好文 时间:
2018-06-30 23:44:53
阅读次数:
410
# -*- coding: utf-8 -*-"""Created on Sat Jun 30 10:09:47 2018测试分组groupby@author: zhen"""from pandas import DataFrame"""data = [ [1,2,2,1] [2,2,2,2] [1 ...
分类:
编程语言 时间:
2018-06-30 14:37:54
阅读次数:
184
1.模块的选择 python与c#交互目前有两种方式,一种是使用ironpython模块,另一种是使用pythonnet模块。笔者推荐使用pythonnet,因为ironpython不支持c#中的一些模块,如比较有名的pandas,numpy等。 2.使用pythonnet 使用pip下载pytho ...
分类:
编程语言 时间:
2018-06-29 20:35:17
阅读次数:
283