文件内容: cat ,more,less 文件截取:head,tail 按列抽取:cut 排序和统计:sort,wc cat [OPTION]... [FILE]... //用于查看字符文件 -E:显示行结束符$ -n:对显示出的每一行进行编号 -A:显示所有控制符 -b:非空行编号 -s:压缩连续 ...
分类:
系统相关 时间:
2019-11-29 09:24:02
阅读次数:
91
sed基本用法 案例1:sed基本用法 案例2:使用sed修改系统配置 案例3:sed多行文本处理 案例4:sed综合脚本应用 1案例1:sed基本用法 1.1问题 本案例要求熟悉sed命令的p、d、s等常见操作,并结合正则表达式,完成以下任务: 删除文件中每行的第二个、最后一个字符 将文件中每行的 ...
分类:
其他好文 时间:
2019-11-27 12:22:41
阅读次数:
74
正则表达式 正则表达式的定义: 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母) 和特殊字符(称为"元字符")。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法 规则的字符串。 正则表达式的作用:(1)通用的字符串表达框架;(2)简 ...
分类:
编程语言 时间:
2019-11-23 20:08:01
阅读次数:
68
字符串和文本处理(String and text processing) Convert: 一个可扩展和可配置的类型转换框架 Format: format库提供了一种类型安全的机制,用于根据类似printf的格式字符串格式化参数 Iostreams: Boost.IOStreams 提供了一个定义流 ...
分类:
其他好文 时间:
2019-11-20 22:01:04
阅读次数:
134
富文本处理 富文本(Rich Text)或者叫做富文本格式,简单来说就是在文档中可以使用多种格式,比如字体颜色、图片和表格等等。它是与纯文本(Plain Text)相对而言的,比如Windows上的记事本就是纯文本编辑器,而Word就是富文本编辑器。 富文本文档结构 文本块 表格、列表与图片 查找功 ...
分类:
其他好文 时间:
2019-11-14 09:37:34
阅读次数:
174
文本处理 awk sed grep sort uniq cat cut echo fmt tr nl egrep fgrep wc 进程监视 ps top htop atop lsof 网络 nmap tcpdump ping mtr tracerote airmon airodump dig ip ...
分类:
系统相关 时间:
2019-11-11 12:42:20
阅读次数:
98
文本处理工具awk awk:(Aho, Weinberger, Kernighan,)报告生成器,格式化文本输出 有多种版本:New awk(nawk),GNU awk( gawk) @[toc] gawk:模式扫描和处理语言 awk语言 ?成需要的测试数据: [root@magedu ~] hea ...
分类:
其他好文 时间:
2019-11-06 22:47:39
阅读次数:
154
一、grep搜索命令 在日常使用中grep命令也是会经常用到的一个搜索命令。grep命令用于在文本中执行关键词搜索,并显示匹配的结果。 格式: Usage: grep [OPTION]... PATTERN [FILE]... 常用选项: 正则匹配: ‘\?‘:匹配其前面的字符0次或者1次; ‘\+ ...
分类:
其他好文 时间:
2019-11-04 15:19:36
阅读次数:
83
首先介绍下grep命令: grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。它是linux中最常用的“文本处理 ...
分类:
其他好文 时间:
2019-11-01 16:33:15
阅读次数:
79
是基本算法,和决策树一样,是树模型中的基础算法,朴素贝叶斯是贝叶斯中的一个算法,是基于统计学的,在文本处理领域应用广泛。 需要先掌握贝叶斯定理: 联合概率(两个事件同时发生的概率) 条件概率(事件A发生的情况下,B的概率)= AB的联合概率/A发生的概率 乘法公式:条件概率变形 联合概率—天剑概率— ...
分类:
其他好文 时间:
2019-10-30 18:15:05
阅读次数:
69