1,series.values, seires.index.tolist(), series.items() values、index、items返回的对象分别是List、Index、Zip类型的数据 from pandas import Seriesemp=['001','002','003',' ...
分类:
其他好文 时间:
2020-07-19 23:53:16
阅读次数:
110
1,Series创建 1)列表+[索引], 索引不填时默认从0-N from pandas import Series , DataFrame weight = [3.5065, 3.4882, 3.4849, 3.4885, 3.4942 ] ses = Series(data = weight) ...
分类:
其他好文 时间:
2020-07-18 22:31:47
阅读次数:
70
用户对于购买商品的行为分析案例 import pandas as pd from pandas import DataFrame,Series import numpy as np import matplotlib.pyplot as plt %matplotlib inline #数据量级达到一 ...
分类:
其他好文 时间:
2020-07-18 15:41:01
阅读次数:
137
数据选择 行选择、列选择、行列同时选择 列选择 一列 df['操作人'] 多列:嵌套列表 df[['操作人',['部门']]]#返回dataframe 列的位置:iloc #iloc:接受行,列 df[:,1:5]#所有行,1-4列 df[[0,3,4],[0,3,4]]#0,3,4行、列 行标签 ...
分类:
其他好文 时间:
2020-07-17 11:37:25
阅读次数:
76
pandas的apply函数是自动根据function遍历每一个数据,然后返回一个数据结构为Series的结果 DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds) 参数解释: ...
分类:
移动开发 时间:
2020-07-16 12:31:46
阅读次数:
104
在juoyter notebook中直接通过df输出DataFrame时,显示的样式为表格样式,通过sytle可对表格的样式做一些定制,类似excel的条件格式。 df = pd.DataFrame(np.random.rand(5,4),columns=['A','B','C','D']) s = ...
分类:
其他好文 时间:
2020-07-14 18:13:51
阅读次数:
71
1.表格样式创建 表格视觉样式:Dataframe.style → 返回pandas.Styler对象的属性,具有格式化和显示Dataframe的有用方法 样式创建:① Styler.applymap:elementwise → 按元素方式处理Dataframe② Styler.apply:colu ...
分类:
其他好文 时间:
2020-07-11 20:55:14
阅读次数:
118
一、概述 k-近邻算法(k-Nearest Neighbour algorithm),又称为KNN算法,是数据挖掘技术中原理最简单的算法。KNN 的工作原理:给定一个已知标签类别的训练数据集,输入没有标签的新数据后,在训练数据集中找到与新数据最邻 近的k个实例,如果这k个实例的多数属于某个类别,那么 ...
分类:
编程语言 时间:
2020-07-11 17:13:58
阅读次数:
54
csv 转存为json import csv import json csvfile = open('test.csv', 'r') jsonfile = open('record.json', 'w') headers = ['class', 'name', 'sex', 'height', 'y ...
分类:
Web程序 时间:
2020-07-08 13:27:31
阅读次数:
68
repartition repartition 有三个重载的函数: 1) def repartition(numPartitions: Int): DataFrame /** * Returns a new [[DataFrame]] that has exactly `numPartitions` ...
分类:
数据库 时间:
2020-07-08 13:17:49
阅读次数:
93