ipython notebook 命令行输入ipython notebook 此时,浏览器会自动运行并打开ipython网页 基本操作 如上图所示,新建一个项目 导入相关模块,建立一个数据集 制造数据缺失项,并给新插入部分部分赋值 这样就构造了一个二维的DataFrame数组,其中包含了一些空数据 ...
分类:
Web程序 时间:
2017-07-15 18:59:47
阅读次数:
196
1.相关库导入 2.创建数据结构 pandas 有两个重要的数据结构: Series 和 DataFrame 创建Series数组,代表一行或一列 创建DataFrame ,代表二维数组 第一种方式: 第二种方式: 3.查看数据 (1).head() 默认返回前五行的数据,括号里加参数可指定返回前几 ...
分类:
其他好文 时间:
2017-07-15 17:48:57
阅读次数:
164
一:pandas的数据类型 pandas中最重要的数据类型是Series序列 和 DataFrame数据框,Series相当于Numpy中的一维数组,不同之处series会自带索引值。dataframe相当于numpy的二维数组。 1.1)Series的创建 有两种方式:通过一维数组 和 字典 1) ...
分类:
编程语言 时间:
2017-07-10 22:04:05
阅读次数:
377
1.DataFrame的创建方式 1.1 通过加载外部文件创建 1.2 通过RDD和元数据进行转换 1.2.1 通过使用动态构建的元数据的方式创建DataFrame 1.2.2 通过反射的方式,使用javabean的属性作为DataFrame的元数据进行创建DataFrame 1.2.3 使用hiv ...
分类:
其他好文 时间:
2017-07-09 17:27:22
阅读次数:
255
用广晟有色的历史数据,用sklearn进行回归,数据如下: 假设每日振幅和成交量以及价格是有关系的,于是构造:# coding=utf-8 from pandas import Series,DataFrame import pandas as pd import numpy as np from ... ...
分类:
其他好文 时间:
2017-07-08 12:25:00
阅读次数:
480
存入字典resul{}中--通过循环将每则新闻信息append到最后的列表alllist--使用pandas函数、DataFrame方法将列表整理,最终导出为excel表格 ...
分类:
其他好文 时间:
2017-07-08 12:15:57
阅读次数:
175
定义一个dataframe: >>> df a b0 1 31 2 4 现在看两种用法: 1.求行的均值 >>> df.mean(axis=1)0 2.01 3.0dtype: float64 2.删除列 >>> df.drop('a',axis=1) b0 31 4 乍看不好理解,但是,记住这句话 ...
分类:
其他好文 时间:
2017-07-07 13:11:30
阅读次数:
238
导入模块: 生成DataFrame数据 DataFrame数据预览: 计算各列数据总和并作为新列添加到末尾 计算各行数据总和并作为新行添加到末尾 最终数据结果: 2017-07-07 11:19:54 ...
分类:
其他好文 时间:
2017-07-07 13:08:21
阅读次数:
471
NumPy学习 NumPy重要的一个特点:是一个N维数组对象。提供了shape(指明行数、列数)和dtype(数据类型) 初始化 注意,如果有切片来自于该数据,改变切片,也会改变原来的数据。 Panda 主要由Series和DataFrame组成。 Series 1,Series包括了index和v ...
分类:
其他好文 时间:
2017-07-06 22:51:38
阅读次数:
202
Spark SQL中的DataFrame类似于一张关系型数据表。在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现。可以参考,Scala提供的DataFrame API。 本文中的代码基于Spark-1.6.2的文档实现。 一、DataFrame对象的生成 ...
分类:
数据库 时间:
2017-07-06 16:58:40
阅读次数:
641