Pandas基础篇 Pandas基于Numpy开发,提供了很多高级的数据处理功能。 1、Pandas中的数据对象 Series和DataFrame是Pandas中最常用的两个对象。 1.1 Series对象 是Pandas中最基本的对象,可用Numpy的数组处理函数直接对Series对象进行处理。支 ...
                            
                            
                                分类:
其他好文   时间:
2017-12-27 21:34:41   
                                阅读次数:
909
                             
                         
                    
                        
                            
                            
                                在pandas.dataframe转换时,会使用默认的6位小数,导致数据经常精度不够。 df.round()不起作用。所以只能用暴力的设置全局 pd.set_option('precision', 8) 可以解决转换时候的精度丢失 ...
                            
                            
                                分类:
其他好文   时间:
2017-12-26 14:45:12   
                                阅读次数:
522
                             
                         
                    
                        
                            
                            
                                    删除pandas DataFrame的某一/几列: 方法一:直接del DF['column-name'] 方法二:采用drop方法,有下面三种等价的表达式: 1. DF= DF.drop('column_name', 1); 2. DF.drop('column_name',axis=1, inp ...
                            
                            
                                分类:
编程语言   时间:
2017-12-26 11:58:08   
                                阅读次数:
2388
                             
                         
                    
                        
                            
                            
                                参考书籍:《利用Python进行数据分析》 DataFrame简介: DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。跟其他类似的数据结构相 ...
                            
                            
                                分类:
其他好文   时间:
2017-12-25 19:25:47   
                                阅读次数:
422
                             
                         
                    
                        
                            
                            
                                    numpy: import numpy as np 布尔型索引: 给一个数组,选出数组中所有大于5的数和偶数。 答案:arr[(a>5) & (a%2==0)] 或是| 非是~ 花式索引* 对于一个数组,选出其第1,3,4,6,7个元素,组成新的二维数组。 答案:arr[[1,3,4,6,7]] 对 ...
                            
                            
                                分类:
其他好文   时间:
2017-12-24 16:56:18   
                                阅读次数:
149
                             
                         
                    
                        
                            
                            
                                    For example we have dataframe like this: Now we only we want to get highlighted part: We can use Dataframe.ix[] method to get date related index data  ...
                            
                            
                                分类:
编程语言   时间:
2017-12-17 23:49:10   
                                阅读次数:
210
                             
                         
                    
                        
                            
                            
                                    转自:http://blog.csdn.net/wangying19911991/article/details/73928172 https://www.zhihu.com/question/58993137 python中的axis究竟是如何定义的呢?他们究竟代表是DataFrame的行还是列? ...
                            
                            
                                分类:
编程语言   时间:
2017-12-12 17:26:43   
                                阅读次数:
215
                             
                         
                    
                        
                            
                            
                                可视化 1、sql server,尽量不使用,pd.DataFrame.to_sql写入数据有问题 https://download.microsoft.com/download/3/C/7/3C77BAD3 4E0F 4C6B 84DD 42796815AFF6/SSMS Setup CHS.ex ...
                            
                            
                                分类:
数据库   时间:
2017-12-11 20:01:55   
                                阅读次数:
197
                             
                         
                    
                        
                            
                            
                                pandas: 基于Numpy构建的数据分析库 pandas数据结构:Series, DataFrame Series: 带有数据标签的类一维数组对象(也可看成字典) values, index 缺失数据检测:pd.isnull(), pd.notnull(), Series对象的实例方法 Seri ...
                            
                            
                                分类:
编程语言   时间:
2017-12-09 14:51:10   
                                阅读次数:
251
                             
                         
                    
                        
                            
                            
                                    #构造case class,利用反射机制隐式转换 scala> import spark.implicits._ scala> val rdd= sc.textFile("input/textdata.txt") scala> case class Person(id:Int,name:String... ...
                            
                            
                                分类:
其他好文   时间:
2017-12-07 12:00:09   
                                阅读次数:
378