# 从csv文件创建DataFrame类型的数据结构 >>>df=pd.read_csv("xxx.csv") # DataFrame类型的形状和长度 >>> df.shape (38, 39) >>> len(df) 38 # 各列的标题和数据类型 >>> df.columns >>> df.dt... ...
分类:
编程语言 时间:
2018-07-21 21:23:56
阅读次数:
163
正则表达式的分类 基本的正则表达式(Basic Regular Expression 又叫Basic RegEx 简称BREs) 扩展的正则表达式(Extended Regular Expression 又叫Extended RegEx 简称EREs) Perl的正则表达式(Perl Regular ...
分类:
系统相关 时间:
2018-07-21 19:50:58
阅读次数:
240
ELK是三个开源软件的缩写,分别表示:Elasticsearch , Logstash, Kibana , 它们都是开源软件。新增了一个FileBeat,它是一个轻量级的日志收集处理工具(Agent),Filebeat占用资源少,适合于在各个服务器上搜集日志后传输给Logstash。 Elastic ...
分类:
其他好文 时间:
2018-07-20 11:29:54
阅读次数:
195
sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,将数据行进行替换、删除、新增、选取等。sed -help 查看sed的用法-n, --quiet, --silent suppress automatic printing of pattern space阻止默认输出(显 ...
分类:
系统相关 时间:
2018-07-20 11:20:49
阅读次数:
198
vcf格式示例 ##fileformat=VCFv4.1 ##FILTER=<ID=LowQual,Description=”Low quality”> ##FORMAT=<ID=AD,Number=.,Type=Integer,Description=”Allelic depths for the ...
分类:
其他好文 时间:
2018-07-18 21:39:36
阅读次数:
418
awk是基于列的文本处理工具,它的工作方式是按行读取文本并视为一条记录,每条记录以字段分割成若干字段,然后输出个字段的值,事实上,awk是一种编程语言。awk认为文件都是结构化的,也就是说由单词和各种空白字符组成的,这里的‘空白字符’包括空格,Tab,以及连续的空格和tab等。每个非空白的部分叫做域,从做到右依次是第一个域,第二个域,等等。$1、$2
分类:
系统相关 时间:
2018-07-16 16:21:50
阅读次数:
191
sed(stream editor)是一种非交互的流编辑器,通过多种转换修改流经它的文本。但是,默认情况下,sed并不会改变原文件本身,而只是通过sed命令的文本进行修改,并将修改后的结果打印到标准输出中(也就是屏幕)。sed处理文本时是以行为单位的,每处理完一行就立即打印出来,然后再处理下一行,直至全文处理结束。准备如下文件Sed.txtthis&
分类:
系统相关 时间:
2018-07-16 12:26:24
阅读次数:
228
wc命令:统计常用选项:-l:显示行数-w:显示单词数(以空格分隔为一个单词)-c:显示字符数cut命令:切割常用选项:-d:指明分隔符-f#:指明第几个字段,如,1;1,2;1-3sort命令:排序常用选项:-f:忽略字符大小写-r:逆序-t:字段分隔符-k#:以指定字段为标准排序-n:以数值大小进行排序-u:排序后去重uniq:去重常用选项:-c:显示每行重复出现的次数-d:仅显示重复过的行-
分类:
其他好文 时间:
2018-07-11 12:24:04
阅读次数:
146