机器学习实战笔记-1基础

时间：2017-06-03 17:37:38 阅读：232 评论：0 收藏：0 [点我收藏+]

机器学习基础

机器学习能让我们从数据集中受到启示。换句话说。我们会利用计算机来彰显数据背后的真实含义。简单的说机器学习就是把无序数据转换成实用的信息。

特征(属性)：对一类物体我们关心的性质，比方鸟的体重、翼展、脚蹼、后背颜色等

训练集：已经有分类的大量数据。是用来训练机器学习算法的数据样本集合。

训练样本：实例数据

目标变量：机器学习的预測结果

训练数据：用来训练算法

測试数据：用来评估算法

监督学习：

无监督学习：

机器学习的主要任务时分类和回归。

分类和回归都属于监督学习。分类和回归的差别是回归用于预測数值型数据。

在无监督学习中：

聚类：将数据集合分层有类似的对象组成的多个类的过程

密度分析：寻找描写叙述数据统计值的过程

假设选择合适算法：

选择的根据：

1使用算法的目的，2分析或者收集的数据是什么

选择的过程：

1依据目的首先划分是监督学习，还是无监督学习。假设要预測目标变量的值，则能够选择监督学习算法，否则选择无监督学习算法

2假设是监督学习：进一步确定目标变量的类型，假设是离散型。选择分类算法。否则选择回归算法

3假设是非监督学习：进一步分析是否只须要将数据划分为离散的组。假设是则选择聚类算法。否则选择密度预计算法。

1 收集数据：爬虫、传感器等

2 准备输入数据：格式处理等

3 分析输入数据：确保数据集中无垃圾数据。

4 训练算法：(无监督学习不须要训练算法)

5 測试数据：

6 使用算法

原文地址：http://www.cnblogs.com/ljbguanli/p/6937625.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行