码迷,mamicode.com
首页 >  
搜索关键字:数据挖掘算法    ( 157个结果
数据挖掘算法学习(七)SVM
SVM,支持向量机。数据挖掘中的一个经典算法,博主学了挺久,把学到的一些东西跟大家分享一下。 支持向量机(SVM,Support Vector Machine)是在高维特征空间使用线性函数假设空间的学习系统,它由一个来自最优化理论的学习算法训练,该算法实现了一个由统计学习理论到处的学习偏置.此学习策略由Vapnik和他的合作者提出,是一个准则性的 并且强有力的方法.在它提出来的若干年来,在范...
分类:编程语言   时间:2014-10-11 19:34:26    阅读次数:352
数据挖掘算法之-关联规则挖掘(Association Rule)(购物篮分析)
在各种数据挖掘算法中,关联规则挖掘算是比较重要的一种,尤其是受购物篮分析的影响,关联规则被应用到很多实际业务中,本文对关联规则挖掘做一个小的总结。 首先,和聚类算法一样,关联规则挖掘属于无监督学习方法,它描述的是在一个事物中物品间同时出现的规律的知识模式,现实生活中,比如超市购物时,顾客购买记录常常隐含着很多关联规则,比如购买圆珠笔的顾客中有65%也购买了笔记本,利用这些规则,商场人员可以很...
分类:其他好文   时间:2014-10-08 18:24:35    阅读次数:251
(原创)大数据时代:数据分析之基于微软案例数据库数据挖掘案例知识点总结
随着大数据时代的到来,数据挖掘的重要性就变得显而易见,几种作为最低层的简单的数据挖掘算法,现在利用微软数据案例库做一个简要总结。应用场景介绍其实数据挖掘应用的场景无处不在,很多的环境都会应用到数据挖掘,之前我们没有应用是因为还没有学会利用数据,或者说还没有体会到数据的重要性,现在随着IT行业中大数据...
分类:数据库   时间:2014-09-29 22:12:11    阅读次数:362
数据挖掘算法之-关联规则挖掘(Association Rule)(购物篮分析)
在各种数据挖掘算法中,关联规则挖掘算是比较重要的一种,尤其是受购物篮分析的影响,关联规则被应用到很多实际业务中,本文对关联规则挖掘做一个小的总结。 首先,和聚类算法一样,关联规则挖掘属于无监督学习方法,它描述的是在一个事物中物品间同时出现的规律的知识模式,现实生活中,比如超市购物时,顾客购买记录常常隐含着很多关联规则,比如购买圆珠笔的顾客中有65%也购买了笔记本,利用这些规则,商场人员可以很...
分类:其他好文   时间:2014-09-25 20:36:57    阅读次数:260
数据挖掘算法学习(五)C4.5
分类决策树算法,其核心算法是ID3算法。目前应用在临床决策、生产制造、文档分析、生物信息学、空间数据建模等领域。算法的输入是带类标的数据,输出是树形的决策规则。...
分类:其他好文   时间:2014-09-24 13:42:06    阅读次数:310
数据挖掘算法学习(六)CART
分类回归树算法:CART(Classification And Regression Tree)算法采用一种二分递归分割的技术,将当前的样本集分为两个子样本集,使得生成的的每个非叶子节点都有两个分支。因此,CART算法生成的决策树是结构简洁的二叉树。 分类树两个基本思想:第一个是将训练样本进行递归地划分自变量空间进行建树的想法,第二个想法是用验证数据进行剪枝。 CART与C4.5的...
分类:其他好文   时间:2014-09-24 12:33:26    阅读次数:230
数据挖掘算法修炼--协同过滤Collaborative Filtering
从外部看协同过滤 从互联网上寻找有用的信息越来越难,这催生了三类方法:信息检索、信息过滤和推荐系统。信息检索是指Google、百度这样的搜索引擎,这是一种被动的方式;信息过滤是指先对信息进行分类,再根据用户的偏好进行过滤,比如我们注册知乎/豆瓣/微博等时都会要求选择感兴趣的领域,之后会对我们选定领域...
分类:其他好文   时间:2014-08-24 01:32:51    阅读次数:196
蔡先生论道大数据十九:王羲之与大数据
2013年德勤公司发布了一份《2013年艺术品在线交易报告》,显示艺术品投资交易方式由线下慢慢朝着线上交易的方式转变,过去几年至少有80%的藏家尝试过在线购买艺术品,这一趋势还在不断上升。对于艺术品电商来说是个好势头。但艺术品电商如何找到潜在市尝定位目标客户,提高用户..
分类:其他好文   时间:2014-08-22 02:51:15    阅读次数:291
数据挖掘算法学习(三)NaiveBayes算法
算法简单介绍NBC是应用最广的分类算法之中的一个。朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同一时候,NBC模型所需预计的參数非常少,对缺失数据不太敏感,算法也比較简单。算法如果给定目标值时属性之间互相条件独立。算法输入训练数据T={(x1,y1),(x2,y2),…...
分类:其他好文   时间:2014-08-16 22:26:21    阅读次数:353
数据挖掘算法学习(四)PCA算法
算法简介 主成分分析(PrincipalComponentAnalysis,简称PCA)是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。主要用于对特征进行降维。 算法假设 数据的概率分布满足高斯分布或是指数型的概率分布。方差高的向量视为主元。...
分类:其他好文   时间:2014-07-29 14:32:48    阅读次数:196
157条   上一页 1 ... 13 14 15 16 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!