昨天学习了简单的文本处理,之后在课后的练习中实现了包括了对tf-idf的处理和基于朴素贝叶斯简单的文本分类 基于tf-idf的数据集在出现多个关键词的时候一般能够相对准确对文本进行分类,但是对于相对具有深层含义的内容,例如情感的积极,情感的消息这方面的分类来说,就显得有些乏力的。根据昨天构建的文本分 ...
分类:
其他好文 时间:
2020-07-09 10:48:09
阅读次数:
72
1、统计出/etc/passwd文件中其默认shell为非/sbin/nologin的用户个数,并将用户都显示出来[root@centos7scripts]#grep-v‘/sbin/nologin$‘/etc/passwd|cut-d:-f1rootsyncshutdownhaltkyletest[root@centos7~]#awk-F:‘{if($NF!="/sbin/nologin"){p
分类:
其他好文 时间:
2020-07-06 00:42:07
阅读次数:
89
# 正则表达式基础知识# # # # # # 使用正则表达式时,能用简单表达式,就不要用复杂的表达式。因为越复杂的正则表达式效率反而不高且易读性极差。# # # # 一.概述# # # 正则表达式,Regular# Expression,缩写为regex、regexp、RE等。 正则表达式是文本处理 ...
分类:
其他好文 时间:
2020-07-04 23:03:13
阅读次数:
68
1.vi编辑器有三种基本模式:(1)命令模式:vi的默认模式。所有的输入被解释成vi命令,还可以执行修改、复制、移动、粘贴、删除正文等命令,还可以操作移动光标、搜索字符串、退出vi的操作等。(2)编辑模式:在编辑模式中,可以往一个文件中输入正文。使用ESC键可以返回命令行模式(3)扩展模式: 在一些 ...
分类:
系统相关 时间:
2020-07-04 15:04:02
阅读次数:
83
目的:分享Pycharm中使用正则的分组匹配来进行批量替换的小技巧 一、PyCharm的搜索/替换快捷键: 查找:Ctrl+F 替换:Ctrl+R 查找是Find,替换是Replace。 二、正则表达式匹配 用途:文本处理 1.相同字符串匹配替换处理: 2.土办法匹配字符串替换处理: 3.正则匹配字 ...
分类:
编程语言 时间:
2020-07-03 17:24:04
阅读次数:
76
一、概述 1、nginx架构 2、18:17 ...
分类:
系统相关 时间:
2020-07-02 16:27:03
阅读次数:
70
1、grep工具grep是行运滤工具;用于根据关键字进行过滤# grep [] '关键字' 文件名 -i::不区分大小写 -v:查找不包含指定内容的行,反向选择 -w:按单词搜索 -o:打印匹配关键字 -c:统计匹配的次数 -n:显示行号 -r:逐层遍历目录查找 -A:显示匹配行及及后面多少行 -B ...
分类:
其他好文 时间:
2020-07-01 00:12:55
阅读次数:
97
一、回顾 1、lvs:四层路由器,四层交换机; 2、lvs-type: a、nat/dr/tun/fullnat b、nat/fullnat:请求和响应报文都经由Director; (1)、nat:仅修改请求报文的目标IP,和端口 (2)、fullnat:修改请求报文的源和目标IP,和目标端口 c、 ...
分类:
系统相关 时间:
2020-06-30 17:09:33
阅读次数:
69
正则表达式(Regular Expressions),又被称为regex、regexp 或 RE,是一种十分简便、灵活的文本处理工具。它可以用来精确地找出某文本中匹配某种指定规则的内容。从C++11开始也将正则表达式纳入了新标准的一部分 。 本篇博客不涉及正则表达式语法的基本内容,如果你对正则表达式 ...
分类:
编程语言 时间:
2020-06-25 23:47:03
阅读次数:
116
背景 毕业论文选择了文本处理的情感分析。交了论文的初稿后,导师看了觉得写得不错,希望我冲击一下优秀论文,给我推荐了bert算法让我再去跑一趟。本是第一次接触NLP的我又去看了这个前2年才由谷歌开发出来的算法,简直头皮发麻。在google开源代码的run_classifier.py里添加了自己的Pro ...
分类:
其他好文 时间:
2020-06-25 16:06:01
阅读次数:
205