df_org = pd.read_csv(path) print(df_org.head(5)) df_org.columns = ["UserID", "Gender", "Age", "Attribution", "Type", "StartTime", "EndTime", "Log", "L ...
分类:
编程语言 时间:
2020-11-16 14:00:41
阅读次数:
21
刚开始我就在想如何获取总磁盘空间的大小呢?是df -h命令,把Size里所有的空间都相加?但是里面有挂载的一些目录也算进来,肯定不对。或者直接算/目录下的总大小?看似就是这样,但实际上是没有算进外挂的硬盘,也不对的。
分类:
系统相关 时间:
2020-11-13 12:29:31
阅读次数:
24
各个代码代表的含义: 数 据 项说 明必填项(是/否) C 期初余额 是 JC 借方期初余额 是 DC 贷方期初余额 是 AC 期初绝对余额 是 Y 期末余额 是 JY 借方期末余额 是 DY 贷方期末余额 是 AY 期末绝对余额 是 JF 借方发生额 是 DF 贷方发生额 是 JL 借方本年累计发 ...
分类:
其他好文 时间:
2020-11-12 13:48:07
阅读次数:
6
#!/bin/sh use=`df|grep "/dev/vdb1"|awk '{print $5}'| sed 's/%//g'` if [[ $use -gt 80 ]];then hdfs dfs -rm -r -skipTrash /user/admin/.flink fi; 先编写好she ...
分类:
系统相关 时间:
2020-11-08 16:52:29
阅读次数:
30
pandas.to_csv 中文乱码问题 df.to_csv("predict_result.csv",encoding="utf_8_sig") 打印所在机器的内存大小 import psutil def print_memory_size(): '''输出系统内存''' mem = psutil ...
分类:
编程语言 时间:
2020-11-04 18:23:03
阅读次数:
19
spark sql 的function中有一个 instr 可以判断其中一列是否是另外一列的子字符 新增字段 判断一个字段是否包含另一个字段的字符串,如果包含值为1否则是0 Df.withColumn("newColumn",when(instr(col("aColumn"),col("bColum ...
分类:
数据库 时间:
2020-10-27 10:54:18
阅读次数:
55
###查看 Linux 版本 uname -a lsb_release -a cat /etc/lsb_release cat /etc/issue cat /proc/version 不同版本的命令可能不一样 ###查看 CPU 信息 lscpu cat /proc/cpuinfo 会显示出物理核 ...
分类:
系统相关 时间:
2020-10-26 10:39:44
阅读次数:
27
Pandas 数据清洗常见方法 01 读取数据 df=pd.read_csv('文件名称') 02 查看数据特征 df.info() 03 查看数据量 df.shape 04 查看各数字类型的统计量 df.describe() 05 去除重复值 df.drop_duplicates(inplace= ...
分类:
其他好文 时间:
2020-10-21 21:22:59
阅读次数:
31
今天买的一台服务器发现其硬盘容量与购买界面的描述不符,于是我去问了客服才知道有一块硬盘需要自己挂载,所以记录自己硬盘分区以及挂载操作得此文。 测试环境 ? 由于时间限制,本人仅在centos 8下测试通过,理论上适用于几乎所有的linux发行版。 硬盘分区 ? 输入df -h查看当前系统的硬盘容量使 ...
分类:
系统相关 时间:
2020-10-21 21:22:07
阅读次数:
34
一、创建excel import pandas as pd df = pd.DataFrame() df.to_excel('C:/Temp/output.xls') print('Done!') 试着添加一些数据 import pandas as pd df = pd.DataFrame({'ID ...
分类:
其他好文 时间:
2020-10-18 16:33:11
阅读次数:
20