1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h ...
分类:
其他好文 时间:
2020-05-21 10:23:57
阅读次数:
57
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, ...
分类:
其他好文 时间:
2020-05-21 09:55:55
阅读次数:
60
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h ...
分类:
其他好文 时间:
2020-05-20 20:26:30
阅读次数:
63
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 执行代码: 运行结果: 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # ...
分类:
其他好文 时间:
2020-05-20 20:13:08
阅读次数:
59
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path = r"SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') data = csv.reader(sms, deli ...
分类:
其他好文 时间:
2020-05-20 12:11:10
阅读次数:
47
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path = r"SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') data = csv.reader(sms, deli ...
分类:
其他好文 时间:
2020-05-19 23:11:49
阅读次数:
147
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv sms=open("D:\机器学习\SMSSpamCollection",'r',encoding='utf-8') csv_reader=csv.reader(sms, delimiter='\t') for ...
分类:
其他好文 时间:
2020-05-18 20:22:09
阅读次数:
49
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 代码: 运行截图: 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # s ...
分类:
其他好文 时间:
2020-05-18 16:31:57
阅读次数:
55
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-05-18 14:01:34
阅读次数:
44
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h ...
分类:
其他好文 时间:
2020-05-18 12:42:59
阅读次数:
75