莫凡Python 3 新建模板小书匠 CNN 卷积神经网络 参考资料 https://morvanzhou.github.io/tutorials/machine-learning/keras/2-3-CNN/ https://keras-cn.readthedocs.io/ 数据预处理 X_tra ...
分类:
编程语言 时间:
2020-03-28 17:48:36
阅读次数:
123
数据预处理常用函数 df.duplicated() :判断各行是重复,False为非重复值。 df.drop_duplicates():删除重复行 df.fillna(0):用实数0填充na df.dropna():按行删除缺失数据,使用参数axis=0;按列删除缺失值,使用参数axis=1,how ...
分类:
其他好文 时间:
2020-03-27 17:17:54
阅读次数:
128
《机器学习入门》本书通过通俗易懂的语言,丰富的图示和经典的案例,让广大机器学习爱好者轻松入门机器学习MachineLearning,有效地降低了学习的门槛。本书共分11章节,覆盖的主要内容有机器学习概述、数据预处理、K近邻算法、回归算法、决策树、K-means聚类算法、随机森林、贝叶斯算法、支持向量机、神经网络(卷积神经网络、Keras深度学习框架)、人脸识别入门等。从最简单的常识出发来切入AI领
分类:
编程语言 时间:
2020-03-15 10:04:46
阅读次数:
77
一、文本分词 将需要进行分析的文本进行分词(英文直接按照空格分隔词汇,中文则需通过分词工具分隔之后,把词之间加上空格) 二、去停用词 在文本中可以发现类似”the”、”a”等词的词频很高,但是这些词并不能表达文本的主题,我们称之为停用词。 对文本预处理的过程中,我们希望能够尽可能提取到更多关键词去表 ...
分类:
其他好文 时间:
2020-03-08 17:16:36
阅读次数:
142
from sklearn.preprocessing import OrdinalEncoder model_oe = OrdinalEncoder() string_data_array = model_oe.fit_transform(string_data) string_data_pd = ...
分类:
Web程序 时间:
2020-03-08 09:39:44
阅读次数:
432
@ControllerAdvice是一个controller增强器,主要用于: 1.全局异常处理 2.全局数据绑定 3.全局数据预处理 一.全局异常处理 需要配合@ExceptionHandler来使用,@ExceptionHandler注解用来指明处理的异常类型 效果: 二.全局数据绑定 全局数据 ...
分类:
编程语言 时间:
2020-03-07 19:12:58
阅读次数:
87
简单的预测器 顾名思义,有一定的数据量,分为训练集和测试集(此处暂时不使用validation set),通过训练集训练出一个模型,再将测试集放进去对比其准确度。 前期准备 1.数据预处理 如星期几,天气等表示某种 类型 的变量,使用独热码给予一个向量。 如星期一到星期天,分别对应1000000、0 ...
分类:
其他好文 时间:
2020-03-04 23:34:39
阅读次数:
128
1.数据中心化 将数据规整到[0,1]间: def normalize(arr): arr = arr - arr.min() arr = arr / arr.max() return arr 将数据规整到[-1,1]间: def normalize(arr): arr = arr - arr.mi ...
分类:
编程语言 时间:
2020-02-28 11:47:17
阅读次数:
52
人生苦短,我用 Python 前文传送门: "小白学 Python 数据分析(1):数据分析基础" "小白学 Python 数据分析(2):Pandas (一)概述" "小白学 Python 数据分析(3):Pandas (二)数据结构 Series" "小白学 Python 数据分析(4):Pan ...
分类:
编程语言 时间:
2020-02-28 10:32:05
阅读次数:
67
3.数据预处理: 在现实社会中的数据往往存在噪声数据、缺失值和不一致数据的问题。为了提高数据挖掘工作的效率和准确性,需要使用数据清理、数据集成、数据归约和数据变换等方法对数据进行预处理操作。 数据质量的三个要素是:准确性、完整性和一致性。 3.1 数据清理 数据清理试图填充缺失值、光滑噪声并识别离群 ...
分类:
其他好文 时间:
2020-02-26 01:19:33
阅读次数:
75