1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-05-16 19:09:13
阅读次数:
60
类和对象 参考资料:《Java从入门到精通》/明日科技编著. 4版. 北京:清华大学出版社,2016 一、面向对象概述 面向对象是一种开发思想,它将所有预处理的问题抽象成对象,同时了解这些对象具有哪些相应的属性和行为,以解决这些对象面临的实际问题。 1、对象 对象是指事实存在的 实体 ,如桌子、电脑 ...
分类:
编程语言 时间:
2020-05-16 17:18:50
阅读次数:
75
%% 清屏 clc; clear all; close all; %% 数据预处理 data = importdata('studentscores.csv'); x = data.data(:,1); y = data.data(:,2); % 原始数据的散点图 figure plot(x,y,' ...
分类:
其他好文 时间:
2020-05-15 21:50:10
阅读次数:
86
文本分类实现步骤: 1. 定义阶段:定义数据以及分类体系,具体分为哪些类别,需要哪些数据 2. 数据预处理:对文档做分词、去停用词等准备工作 3. 数据提取特征:对文档矩阵进行降维、提取训练集中最有用的特征 4. 模型训练阶段:选择具体的分类模型以及算法,训练出文本分类器 5. 评测阶段:在测试集上 ...
分类:
其他好文 时间:
2020-05-15 00:17:01
阅读次数:
75
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl ...
分类:
其他好文 时间:
2020-05-14 13:18:59
阅读次数:
66
文章目录 4. Pipelines 管道5. Cross-Validation 交叉验证上一篇:【Kaggle】Intermediate Machine Learning(缺失值+文字特征处理) 4. Pipelines 管道 该模块可以把数据前处理+建模整合起来 好处: 更清晰的代码:在预处理的每 ...
分类:
系统相关 时间:
2020-05-13 23:37:13
阅读次数:
108
高精度定位理论及应用 从移动互联到物联网,位置是一个基础的不可或缺的信息,但是从精细化的行业应用需求来说,只有更高精度的定位信息才能带来更高的价值,人们可以更加精确地知道事物所处的位置,知道人员具体位置在哪儿,更好的管理企业、人员或物资。比如说保障隧道施工人员人身安全,协助监狱搭建全局化、可视化的监 ...
分类:
其他好文 时间:
2020-05-13 10:16:54
阅读次数:
130
Another OCD Patient Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 2259 Accepted Submission(s) ...
分类:
其他好文 时间:
2020-05-12 18:40:48
阅读次数:
56
缺失值、重复值的查看、删除、填充,使用dropna、fillna、interpolate函数处理缺失值,使用duplicated、drop_duplicates函数处理重复值,使用reset_index函数重置行索引 ...
分类:
其他好文 时间:
2020-05-12 18:34:36
阅读次数:
93
https://www.jb51.net/article/178934.htm 在使用深度学习对图像进行训练时,对图像进行随机旋转有助于提升模型泛化能力。然而之前在做旋转等预处理工作时,都是先对图像进行旋转后保存到本地,然后再输入模型进行训练,这样的过程会增加工作量,如果图片数量较多,生成旋转的图像 ...
分类:
其他好文 时间:
2020-05-10 19:22:20
阅读次数:
79