机器学习类型 机器学习模型评估步骤 深度学习数据准备 特征工程 过拟合 解决机器学习问题的一般性流程 机器学习四分支 二分类、多分类以及回归问题都属于监督学习--目标是学习训练输入和对应标签之间的关系。 监督学习只是机器学习的冰山一角。机器学习主要分为4类:监督学习、非监督学习、半监督学习和强化学习 ...
分类:
编程语言 时间:
2018-07-18 23:33:11
阅读次数:
218
#和随机森林一样,基于决策树,采用连续的方式构建树,深度很小max_depth<5.重要的参数n_estimate和learning_rate,这两个参数的y作用在于对模型过拟合化得调整,从而提高模型得泛化能力。 from sklearn.ensemble import GradientBoosti ...
分类:
编程语言 时间:
2018-07-14 19:26:44
阅读次数:
533
#岭回归主要是弥补在数据中出现异常值时,提高线性模型的稳定性,即鲁棒性robust import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn import linear_model impo ...
分类:
编程语言 时间:
2018-07-09 15:18:32
阅读次数:
695
#线性回归最小二乘法 from sklearn import linear_model import sys import tushare as ts import matplotlib.pyplot as plt import pandas as pd import sklearn.metrics ...
分类:
编程语言 时间:
2018-07-08 23:12:46
阅读次数:
272
#数据预处理方法,主要是处理数据的量纲和同趋势化问题。 import numpy as np from sklearn import preprocessing #零均值规范 data=np.random.rand(3,4)#随机生成3行4列的数据 data_standardized=preproc ...
分类:
编程语言 时间:
2018-07-08 19:00:00
阅读次数:
311
层次聚类(hierarchical clustering)可在不同层次上对数据集进行划分,形成树状的聚类结构。AggregativeClustering是一种常用的层次聚类算法。 其原理是:最初将每个对象看成一个簇,然后将这些簇根据某种规则被一步步合并,就这样不断合并直到达到预设的簇类个数。这里的关 ...
分类:
编程语言 时间:
2018-07-01 21:22:44
阅读次数:
3026
密度聚类(Density-based Clustering)假设聚类结构能够通过样本分布的紧密程度来确定。DBSCAN是常用的密度聚类算法,它通过一组邻域参数(??,MinPtsMinPts)来描述样本分布的紧密程度。给定数据集DD={x? 1,x? 2,x? 3,...,x? Nx→1,x→2,x ...
分类:
数据库 时间:
2018-07-01 20:56:25
阅读次数:
219
无聊,顺应一下潮流,学习一下python机器学习吧。 买了一本书,首先分析一下目录吧。 1.第一章是 Python机器学习的生态系统。 1.1.数据科学或机器学习的工作流程。 然后又分成6点进行详细说明:获取,检查和探索,清理和准备,建模,评估,部署。 1.2.讲解了Python库和相应的功能。 这 ...
分类:
编程语言 时间:
2018-06-08 00:38:08
阅读次数:
216
http://www.cuijiahua.com/resource.html 曾看过的书,感觉一些很有用的学习资料,推荐给大家! Python基础: 网络教程推荐: 教程地址:点击查看 2. 系统学完也不一定记得很清楚,这时我们需要一个快速的查询手册,菜鸟教程是一个不错的选择: 教程地址:点击查看 ...
分类:
编程语言 时间:
2018-05-19 19:43:41
阅读次数:
289
机器学习中的监督学习的任务重点在于,根据已有的经验知识对未知样本的目标/标记进行预测。 根据目标预测变量的类型不同,我们把监督学习的任务大体分为分类学习与回归预测两类。 监督学习 任务的基本架构流程:1首先准备训练数据 可以是文本 图像 音频等;2然后抽取所需要的特征,形成特征向量;3接着,把这些特 ...
分类:
编程语言 时间:
2018-05-12 00:05:27
阅读次数:
225