码迷,mamicode.com
首页 > 其他好文 > 详细

大数据应用领域

时间:2014-12-31 16:22:19      阅读:161      评论:0      收藏:0      [点我收藏+]

标签:大数据   spark   

     聚类模型属于飞溅读式挖掘模型,以用户属性、行为、消费等特征数据为输入,将用户自动聚类为若干类,通常用来挖掘潜在目标客户群体,也可以用在大数据营销工具、CRM工具和防欺诈解决方案上。

     分类预测模型分析学习历史数据经验,预测分析未来数据发展方向。模型输出是离散数据或类别的称为分类模型,模型输出是数值类型数据的模型称为数值预测模型。分类模型根据训练数据集的类别号属性,学习现有分类数据的分类规则来构建分类器,最终备用于分类新数据。数值预测模型根据数据输入,对训练数据进行模型拟合,最终建立连续性数值函数。分类预测模型的典型应用有欺诈检测、市场定位、性能预测、医疗诊断、价格预测等。

    关联规则挖掘模型,用于发现隐藏在大型数据集中的令人感兴趣的联系。关联规则挖掘分为“频繁项集产生”和“关联规则产生”两个主要任务。“频繁项集产生”的目的是发现满足最小支持度阈值的所有项集,这些项集称作频繁项集。“关联规则的产生”目标是从上一步发现的频繁项集中提取所有高置信度的规则,这些规则称为强规则。关联规则挖掘模型的典型应用产品关联推荐和精确营销。

大数据应用领域

标签:大数据   spark   

原文地址:http://blog.csdn.net/u013485584/article/details/42295001

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!