码迷,mamicode.com
首页 > 其他好文 > 详细

Spark学习笔记——构建分类模型

时间:2017-05-01 21:03:14      阅读:171      评论:0      收藏:0      [点我收藏+]

标签:学习   而且   spark   向量   需要   park   模型   数据   问题   

Spark中常见的三种分类模型:线性模型、决策树和朴素贝叶斯模型。

线性模型,简单而且相对容易扩展到非常大的数据集;线性模型又可以分成:1.逻辑回归;2.线性支持向量机

决策树是一个强大的非线性技术,训练过程计算量大并且较难扩展(幸运的是,MLlib会替我们考虑扩展性的问题),但是在很多情况下性能很好;

朴素贝叶斯模型简单、易训练,并且具有高效和并行的优点(实际中,模型训练只需要遍历所有数据集一次)。当采用合适的特征工程,这些模型在很多应用中都能达到不错的性能。而且,朴素贝叶斯模型可以作为一个很好的模型测试基准,用于比较其他模型的性能。

 

Spark学习笔记——构建分类模型

标签:学习   而且   spark   向量   需要   park   模型   数据   问题   

原文地址:http://www.cnblogs.com/tonglin0325/p/6792666.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!