码迷,mamicode.com
首页 > 其他好文 > 详细

1.机器学习初体验

时间:2017-06-07 16:58:57      阅读:243      评论:0      收藏:0      [点我收藏+]

标签:ges   比赛   例子   技术   设计   事件   bsp   感知   检测   

机器学习:

  1. 研究的是计算机怎么模拟人类的学习行为,以获取新的知识和技能,
  2. 并重新组织已有的知识结构使之不断改善自身。
  3. 简单一点说:就是计算机从数据(样本,实例)和一定的学习算法中学习出
  4. 规律和模式,以应用在新数据上做预测的任务


今日头条:用机器学习挖掘个体用户感兴趣的新闻
表情检测
alphaGo 人机大战

学习 = 在某项任务上总结与积攒经验
1.在任务T上提升
2.用P作为评估标准
3.基于经验E

  例子:中国象棋
  1.任务T:下中国象棋
  2.性能目标P:比赛中击败对手(的百分比)
  3.训练经验E:计算机和计算机自己进行对弈,或者看棋谱学习

机器学习与人工智能:机器学习是一个人工智能的一个分支,也可以说是一个人工智能的一个实现方式。


思考?
  如何设计无人驾驶机动车?
    传统的方式:提前熟悉每条路况,提前告诉计算机,哪里去哪里怎么走。 这很复杂
          无法处理突发事件
    机器学习方式:设计一套机制,给一些初始数据,让它试着开一开
           效果好,就再接再厉。效果不好,就改正
           自己去学习,自己反馈
           增强式学习
           有摄像头识别路况,图像识别
机器学习算法分类:
监督学习:(分类预测,回归分析)例如用户点击/购买预测,房价预测 告诉了样本当前样本的结果
无监督学习:(聚类,关联规则)例如邮件/新闻聚类 提前不知道有多少类,按标题特征聚类
强化学习:(Q-learning,时间差学习)例如动态系统以及机器人控制

  监督学习:样本中告诉了结果

  监督学习算法:训练/学习(样本带有结果)-》预测(去预测结果)

  无监督学习:样本无target
        把特征相近的样本放在一堆
        自己探索和发现

  增强式学习/RL:行为认知发下的机器学习分支
         Agent感知环境,做出动作,根据奖惩状态feedback做出调整和悬着

连续值(continuous):按数据的input和output 比如房价 200万 205万 206.5万。
离散(Categorical): 按数据的input和output 邮件分类,正常邮件,垃圾邮件,结果只有两个值

 

如何选取适合样本的机器学习算法? 

技术分享

 

 

  

1.机器学习初体验

标签:ges   比赛   例子   技术   设计   事件   bsp   感知   检测   

原文地址:http://www.cnblogs.com/wuwen19940508/p/6957764.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!