import pandas as pd df_policy = pd.read_excel('e:\policy.xlsx') df_sh01 = pd.read_csv('e:\sh01.csv', encoding='gbk') list_not = [] set_found = set() f ...
分类:
其他好文 时间:
2020-04-20 15:32:16
阅读次数:
303
linux 查看磁盘命令 du df 相关命令 ① df -hl: 查看磁盘剩余空间 ② df -h: 查看每个根路径的分区大小 ③ du -sh[目录名]: 返回该目录的大小 ④ du -sm[ 目录名]: 返回该文件夹总 MB 数 ⑤ du -h[目录名]: 查看指定文件夹下的所有文件大小(包含 ...
分类:
系统相关 时间:
2020-04-18 22:48:38
阅读次数:
97
import numpy as np import pandas as pd 1.创建数据 df = pd.DataFrame({'name':['Jack','Alex','Bob','Nancy','Mary','Alice','Jerry','Wolf'], 'course':['Chines ...
分类:
移动开发 时间:
2020-04-18 18:24:38
阅读次数:
133
先来想一下数据分析的流程,第一步获取数据,因此本节内容就是获取数据以及对数据的基本操作。 1.数据导入 1.1 导入.xlsx文件 要导入一个.xlsx后缀的Excel文件,可以使用pd.read_excel(路径)方法 结果: df_review数据包含了两个字段,listing_id和date ...
分类:
编程语言 时间:
2020-04-17 22:08:50
阅读次数:
317
现在来解决在安装树莓派系统时遇到的28GB空闲空间不能被系统使用的问题。用PuTTY远程登录树莓派,查看磁盘状态:pi@raspberrypi:~ $ df -h系统能识别到的磁盘空间总共只有1.7G,装完系统后已经用了1.1G,还剩470M。网络上可以找到两种常用的方法来扩展分区(推荐用第1种):... ...
分类:
其他好文 时间:
2020-04-15 18:06:48
阅读次数:
145
stautilvalprintnmf条件one_hot(单次热)编码?差异选项 各种类别的变量n_hot被转换为n个变量 虚拟变量根据某些条件,n用于不同类别,转换为n-1变量 熊猫将标签变成一克代码 pd.get_dummies(df_NMF ['cluster'])。头(20) tensorfl ...
分类:
其他好文 时间:
2020-04-14 10:58:51
阅读次数:
103
文件系统简单操作 df 【-ahikhtm】 【目录或文件名】 可省略 -h 以人类容易阅读的格式显示 -i 不用磁盘容量而已inno数量显示 du 【-ahskm】文件或目录名称 -s列出总量,不列出每个各别目录的占用容量 -k 以KB列出容量 -m以MB列出容量 -h以人类容易阅读的格式显示 常 ...
分类:
系统相关 时间:
2020-04-13 22:52:58
阅读次数:
90
以更易读的方式显示目前磁盘空间和使用情况 语法: df [选项]... [FILE]... 文件-a, --all 包含所有的具有 0 Blocks 的文件系统 文件--block-size={SIZE} 使用 {SIZE} 大小的 Blocks 文件-h, --human-readable 使用人 ...
分类:
系统相关 时间:
2020-04-12 12:45:41
阅读次数:
82
共性: 1、都是spark平台下的分布式弹性数据集 2、都有惰性机制,创建、转换如map操作时不会立即执行,遇到foreach等Action算子时才开始运算。 3、都会自动缓存计算 4、都有partition概念 区别: 1、RDD不支持sparkSQL操作 2、DF每一行类型固定为Row,只有通过 ...
分类:
其他好文 时间:
2020-04-08 21:03:30
阅读次数:
292
0、在执行 docker 操作时,总是提示错误:no space left on device 1、检查 linux 磁盘占用:df –h 2、了解到 linux 下还有另一个有关磁盘文件的占用 inode:df –ih 了解更多:http://www.ruanyifeng.com/blog/201... ...
分类:
其他好文 时间:
2020-04-08 19:15:13
阅读次数:
206