特征选择 RFormula RFormula是一个很方便,也很强大的Feature选择(自由组合的)工具。 输入string 进行独热编码(见下面例子country) 输入数值型转换为double(见下面例子hour) label为string,也用StringIndexer进行编号 卡方独立检验 ...
分类:
编程语言 时间:
2018-01-31 20:24:50
阅读次数:
1193
关于shell的常用的系统变量,文本处理工具,系统配置文件,系统命令
分类:
系统相关 时间:
2018-01-29 11:34:00
阅读次数:
227
续写vim,shell脚本基础编辑,read命令,BASH,if与case判断语句,文件查找方式,压缩与解压,行文本处理工具sed
分类:
系统相关 时间:
2018-01-27 22:22:17
阅读次数:
271
第三周学习总结目录一.知识脉络图二.shell脚本三.shell登录方式四.文件查找和压缩及tar五.简单的sed文本处理一.知识脉络图二.shell脚本1.shell脚本简介linux下经常会遇到重复输入大量重复命令的问题,如果只是在命令行界面执行,就会显得很繁琐。而shell脚本就解决了这个问题,他是一个可以经过解释执行的文件,在其中保存我i们要执行的命令,下次仅仅执行这个脚本就可以了,为我们
分类:
系统相关 时间:
2018-01-27 21:13:38
阅读次数:
138
[awk]awk <option> ‘<PATTERN> {<action>}‘ <filename> [<filename2> ...] ? ?//文本处理工具比如:df -Ph |awk ‘{print $1,$3}‘//awk中大括号中应该用双引号awk会去分割每行并成分为字段,如
分类:
其他好文 时间:
2018-01-25 15:45:47
阅读次数:
142
XML处理: pip3 install lxml 文本处理:pip3 install requests OpenSSL:pip3 install pyOpenSSL twisted:https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted 下载 Twis ...
分类:
编程语言 时间:
2018-01-25 13:14:09
阅读次数:
280
sed描述sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(patternspace),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件;简化对文
分类:
其他好文 时间:
2018-01-23 01:07:54
阅读次数:
198
sed 编辑器是 Linux 系统管理员的工具包中最有用的资产之一,因此,有必要彻底地了解其应用。 Linux 操作系统最大的一个好处是它带有各种各样的实用工具。存在如此之多不同的实用工具,几乎不可能知道并了解所有这些工具。可以简化关键情况下操作的一个实用工具是 sed。它是任何管理员的工具包中最强 ...
分类:
其他好文 时间:
2018-01-22 19:24:33
阅读次数:
236
1、linux文本处理工具:????文本过滤工具:grep、egrep、fgrep????行编辑工具:sed????格式化文本工具:awk、gawk注意:centos7中,awk是指向gwak的链接文件。[root@localhost ~]# ll -l `which awk`l
分类:
其他好文 时间:
2018-01-22 14:03:53
阅读次数:
169
文本处理工具在用户在使用计算机时极大程度的为用户提供了便利。让用户可以轻松的整理文本,以及从中找出自己想要得到的信息。下面将简单介绍一下一些常用的文本处理工具。1.文件查看命令:cat,tac,rev语法:cat[option]..[file]..-E:显示行结束符$-n:对显示出的每一行进行编号-A:显示所有控制符-b:非空行编号-s:压缩连续的空行成一行分页查看文件:more语法:more[o
分类:
其他好文 时间:
2018-01-21 19:08:27
阅读次数:
163