本文主要探索如何使用深度学习框架 MXNet 或 TensorFlow 实现线性回归模型?并且以 Kaggle 上数据集 USA_Housing 做线性回归任务来预测房价。 回归任务,scikit-learn 亦可以实现,具体操作可以查看 线性回归模型的原理与 scikit-learn 实现。 载入 ...
分类:
Web程序 时间:
2020-03-27 01:11:27
阅读次数:
249
本部分展示一个ML项目,假设是一家房地产公司的新聘数据科学家。下面是这个项目的步骤: 看大图 获取数据 发现和可视化数据以获得见解 准备用于机器学习算法的数据 选择一个模型并进行训练 微调您的模型 介绍您的解决方案 启动,监视和维护系统。 在学习机器学习时,最好尝试使用真实数据而不是人工数据集。本部 ...
分类:
系统相关 时间:
2020-03-19 09:36:51
阅读次数:
96
在各类比赛中经常出现预测回归问题,一般使用scikit learn的模型,本文就对这些类库的使用做一个总结,总结时注重自己做比赛中的使用经验。 1. Ordinary Least Squares(最小二乘法) 最简单的线性模型,损失函数是平方差损失,常用梯度下降法求解参数。 使用要点:这个模型不像其 ...
分类:
其他好文 时间:
2020-02-29 15:05:01
阅读次数:
105
1 简介 scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。 SKlearn官网:http://scikit-lear ...
分类:
其他好文 时间:
2020-02-27 12:52:19
阅读次数:
78
1 sklearn简介 Scikit learn(sklearn)是机器学习中的第三方模块,封装了常用的机器学习算法,涉及回归、降维、分类以及聚类等,提供python接口。 虽然sklearn容纳的算法众多,但使用其中大多数算法的模式(套路)都是一样的,一般流程如下: 1 引入相关数据(包括训练集与 ...
分类:
其他好文 时间:
2020-02-19 21:14:14
阅读次数:
78
获取有效数据 Scikit learn will not accept categorical features by default API里面不知使用默认的特征变量名,因此需要编码 这里我还是有疑问? Need to encode categorical features numerically ...
分类:
其他好文 时间:
2020-02-14 16:17:07
阅读次数:
90
包含:经典机器学习、深度学习、强化学习、计算机视觉、分布式训练、自动建模、平台 1 . 适用于经典机器学习的工具 一、SciKit-learn star 39.2k fork 19.2k scikit-learn 是一种强大的基于 Python 语言的机器学习算法库(https://scikit-l ...
分类:
其他好文 时间:
2020-02-12 22:32:06
阅读次数:
114
@[toc] 1.GradientBoostingClassifier loss :给定损失函数,可选对数似然函数deviance和指数损失函数exponential;默认为deviance;不建议修改。 n_estimators :最大迭代次数,值过小可能会导致欠拟合,值过大可能会导致过拟合,一般 ...
分类:
其他好文 时间:
2020-02-08 23:17:16
阅读次数:
133
随机森林我们对使用决策树随机取样的集成学习有个形象的名字–随机森林。scikit-learn 中封装的随机森林,在决策树的节点划分上,在随机的特征子集上寻找最优划分特征。import numpy as npimport matplotlib.pyplot as pltfrom sklearn imp... ...
分类:
其他好文 时间:
2020-02-08 11:42:30
阅读次数:
117
机器学习介绍 机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。 多领域交叉,涉及概率论、统计学、算法复杂度等多门学科。 分类:监督学习、无监督学习、强化学习(增强学习)、半监督学习、深度学习。 scikit-learn库介绍(sklearn) 依赖Num ...
分类:
其他好文 时间:
2020-02-02 20:03:57
阅读次数:
83