语料库:是我们要分析的所有文档的集合 使用搜狗实验室提供的语料库,里面有一个classlist,里面内容是文件的编号及分类名称 1、导入模块 使用os.walk传入这个目录作为参数,遍历该文件夹下的全部文件,该方法返回一个Truple的数组,第一个root是文件所在目录,第二个是root文件下的子目 ...
分类:
其他好文 时间:
2018-10-01 21:05:15
阅读次数:
213
数据清洗是一项复杂且繁琐的工作,同时也是整个数据分析过程中最为重要的环节。 在python中空值被显示为NaN。首先,我们要构造一个包含NaN的DataFrame对象。 删除表中全部为NaN的行 删除表中任何含有NaN的行 删除表中全部为NaN的列 删除表中任何含有NaN的列 注意:axis 就是” ...
分类:
其他好文 时间:
2018-09-30 12:57:50
阅读次数:
214
需求计算列表内名字一样的值name=[{‘name‘:‘he‘,‘value‘:100,‘ps‘:‘test1‘},{‘name‘:‘quan‘,‘value‘:150,‘ps‘:‘test2‘},{‘name‘:‘he‘,‘value‘:100,‘ps‘:‘test3‘},{‘name‘:‘quan‘,‘value‘:200,‘ps‘:‘test4‘}]代码importpandasaspddf=
分类:
编程语言 时间:
2018-09-21 18:25:35
阅读次数:
234
在做软件的时候我们可能会遇到这样的问题,就是在使用EF的时候,有时候精度不一样, 我们用整数来计算肯定是比浮点数来得快的,但我在MySQL里面存储的数据类型是decimal的,我生成EF后, 里面的数据模型变成了float,那么这时候我们就需要对数据模型进行修改 1.首先,我们找到下面这个 2.找到 ...
分类:
其他好文 时间:
2018-09-21 00:38:15
阅读次数:
489
1. 修改全部列名 df.columns 2. 修改指定列名 df.rename ...
分类:
编程语言 时间:
2018-09-19 10:19:18
阅读次数:
415
环境:CentOS6.5安装:samba-3.5.8.tar.gz安装步骤:tar-xzvfsamba-3.5.8.tar.gzcdsamba-3.5.8cdsource3./autogen.sh./configure--/usr/local/samba--enable-socket-wrapper--enable-nss-wrappermakemaketest(可选)makeinstallcps
分类:
其他好文 时间:
2018-09-17 19:30:18
阅读次数:
145
Surface Evolver 是一个通过表面张力和其他能量研究表面形状的交互程序,表面被描述为三角形组成的面。用户在一个数据文件中定义一个初始的面(点线面体和约束加上程序执行的其他命令,有点像Makefile)。程序通过梯度降低的方法把面朝着最小能量的方向进化。 常用命令基本是一个字母(区分大小写 ...
分类:
其他好文 时间:
2018-09-16 15:50:44
阅读次数:
2743
2018-09-12 Author: 楚格 IDE: Pycharm2018.02 Python 3.7 KeyWord : 继承 Explain: 1 -- -- RUN Result -- ...
分类:
编程语言 时间:
2018-09-12 21:42:43
阅读次数:
175
在此我用的concat作用是加入新的记录,存储数据来用过的,不知道数据量大时候,效率会怎样 注意:要有ignore_index=True,要不然你的DataFrame的索引一直都会是零! ...
分类:
其他好文 时间:
2018-09-12 15:52:04
阅读次数:
1907
数据合并时可以使用merge方法,对两个dataFrame根据某一个series合并,这个方法非常好用,只要找到了合并的标准,新的数据就可以重构出来。 1.命令: pd.merge() on:列名,join用来对齐的那一列的名字,用到这个参数的时候一定要保证左表和右表用来对齐的那一列都有相同的列名。 ...
分类:
其他好文 时间:
2018-09-08 17:59:46
阅读次数:
569