参考csdn 1.句子分割 text_to_word_sequence keras.preprocessing.text.text_to_word_sequence(text, filters='!"#$%&()*+,-./:;<=>?@[\]^_`{|}~\t\n', lower=True, sp ...
分类:
其他好文 时间:
2020-06-15 22:55:49
阅读次数:
70
我推荐一款我自己编写的软件,超级好用!!!而且还是免费!!!直接截图框选就可以翻译,非常方便,适合图片上不可复制的英文识别翻译。可以不夸张的给你说,用了这款软件,你就不用用其他的了!(自己看效果,英语单词,英语句子,英语文章都可以翻译!!!) 一 . 软件功能: 1. 截屏翻译:通过截取屏幕任意位置 ...
分类:
其他好文 时间:
2020-06-15 11:50:32
阅读次数:
342
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-06-14 20:23:08
阅读次数:
60
1.The quick brown fox jumps over a lazy dog. 那只敏捷的棕色狐狸跳过了一只懒惰的狗。 这个句子包含了英语中的26个字母。 2.Was it a bar or a bat I saw ? 我看到的是酒吧还是蝙蝠? 这是一句回文句,顺着读和倒着读是一样的。类似 ...
分类:
其他好文 时间:
2020-06-14 15:00:27
阅读次数:
74
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-06-09 09:49:32
阅读次数:
77
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-06-07 14:56:00
阅读次数:
66
jieba是python的第三方库,使用jieba库需要先安装。jieba是一个中文分词库,可以根据所给的中文句子,提取出可能的词组 jieba库分词依靠词库。利用中文词库,确定汉字之间的关联概率。概率大的组成词组,形成分词效果。除了分词,用户还可以添加自定义的词组 jieba提供了三种分词模式,精 ...
分类:
其他好文 时间:
2020-05-31 18:11:27
阅读次数:
429
解释器模式(Interpreter Pattern)是指给定一门语言,定义它的文法的一种表示,并定义一个解释器,该解释器使用该表示来解释语言中的句子。是一种按照规定语法进行解析的模式。 就比如编译器可以将源码编译解释为机器码,让CPU能进行识别并运行。解释器模式的作用其实与编译器一样,都是将一些固定 ...
分类:
其他好文 时间:
2020-05-30 19:52:50
阅读次数:
110
1.csv文件 分隔符:一般常用的是 ','(逗号分隔符)。但是有些 CSV 文件需要存储文章句子信息等,这些信息 ',' 符是常用字符,容易造成解析出错或者解析方法复杂。可以选用 '^' / '\t' 等不常用的字符作为分隔符。应用途而异,具体问题具体分析。 2.写入csv文件 File csv ...
分类:
其他好文 时间:
2020-05-27 20:10:48
阅读次数:
64
师弟最近写论文,表示太难了!怎么写查重都下不来,怎么办呢?于是拜托我给他找个论文句子改写软件,网上搜一下还真的有。软件长这个样子:想玩玩这个软件的同学可以自己百度搜:小发猫。 ...
分类:
其他好文 时间:
2020-05-26 00:59:50
阅读次数:
1020