今天在学习别人特征工程的时候,看到这样一个函数,max_kcore = pd.DataFrame(list(nx.core_number(graph).items()), columns=["qid", "kcore"]),找了半天找不到nx.core_number()函数返回的是什么。 官方文档是 ...
分类:
Web程序 时间:
2018-09-06 00:08:38
阅读次数:
266
1、合并数据集 ①、多对一合并 我们需要用到pandas中的merge函数,merge函数默认情况下合并的是两个数据集的交集(inner连接),当然还有其他的参数: how里面有inner、outer、left、right,四个参数可以选择,分别代表:交集,并集,参与合并的左侧DataFrame,以 ...
分类:
编程语言 时间:
2018-09-02 18:35:04
阅读次数:
180
出处:https://morvanzhou.github.io/tutorials/data-manipulation/np-pd/3-1-pd-intro/ pandas主要的两个数据结构series,dataframe 可以说numpy是列表形式的,没有数据标签,pandas是字典类型的,表格形 ...
分类:
其他好文 时间:
2018-09-01 21:55:32
阅读次数:
197
dates = pd.date_range('20130101', periods=6)df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates, columns=['A','B','C','D']) 创建了一个dataframe date ...
分类:
其他好文 时间:
2018-09-01 21:53:29
阅读次数:
206
先设定好我们的dataframe: 结果: 一、修改特定的数据 1.1分别根据索引和行(列)号来修改特定的值 结果: 1.2对特定的行进行筛选操作 结果: 1.3对特定的列进行筛选操作: 结果 二、增加一个列 结果: 三、处理没有数据的部分 3.1设定丢失数据 结果: 3.2丢弃操作 丢弃特定的行 ...
分类:
其他好文 时间:
2018-08-30 21:39:10
阅读次数:
2226
参考文档 http://pandas.pydata.org/pandas-docs/version/0.20/ pandas的功能非常强大,支持类似与sql的数据增、删、查、改,并且带有丰富的数据处理函数; 支持时间序列分析功能;支持灵活处理缺失数据等。 pandas的基本数据结构是Series和D ...
分类:
其他好文 时间:
2018-08-28 12:11:19
阅读次数:
196
NumPy: ndarray Pandas: DataFrame Matplotlib: SciPy: integrate linalg optimize signal sparse special stats weave Canopy安装 python变量类型 numbers(数字)——int,l ...
分类:
编程语言 时间:
2018-08-26 22:08:54
阅读次数:
227
20180825 由于现在SQLAlchemy不支持mongodb数据库,sql server不太好用,现在主要用mysql数据库。 可视化 1、sql server,尽量不使用,pd.DataFrame.to_sql写入数据有问题 https://download.microsoft.com/do ...
分类:
数据库 时间:
2018-08-25 18:59:29
阅读次数:
286
1.Series Pandas的Series对象是一个带索引数据构成的一维数组 1)用一个数组创建Series对象 2)通过values和index属性获取数据 3)和Numpy数组一样,数据可以通过Python中的括号索引标签获取 4)对于Series对象的index,默认值为整数序列 5)dat ...
分类:
其他好文 时间:
2018-08-25 17:30:05
阅读次数:
144