以下都是图片(由于在有道笔记本上做的编辑,所以复制拷贝之后发现有问题,所以用图片来做展示)
................中间省略一下输出..........................
分类:
其他好文 时间:
2014-12-30 17:07:09
阅读次数:
176
展示如何用R处理稀疏矩阵和利用GLMNET包...
分类:
Web程序 时间:
2014-12-30 17:05:41
阅读次数:
1054
k-近邻算法(kNN):测量不同特征值之间的距离方法进行分类。 kNN的工作原理:存在一个样本数据集合(训练样本集),并且样本集中每个数据都存在标签,输入没有标签的新数据后,将新数据的每个特征与样本集数据对应的特征进行比较,然后算法提取样本集中特征最相似数据的分类标签。一般来说,只选择样本数据...
分类:
其他好文 时间:
2014-12-30 16:48:27
阅读次数:
209
Classification And Regression Tree(CART)是一种很重要的机器学习算法,既可以用于创建分类树(Classification Tree),也可以用于创建回归树(Regression Tree),本文介绍了CART用于离散标签分类决策和连续特征回归时的原理。决策树创建过程分析了信息混乱度度量Gini指数、连续和离散特征的特殊处理、连续和离散特征共存时函数的特殊处理和后剪枝;用于回归时则介绍了回归树和模型树的原理、适用场景和创建过程。个人认为,回归树和模型树可以被看做“群落分类...
分类:
编程语言 时间:
2014-12-30 13:40:48
阅读次数:
767
R语言:利用相关性分析对复杂数据进行数据探索...
分类:
编程语言 时间:
2014-12-30 13:38:13
阅读次数:
300
前言 本文将介绍机器学习分类算法中的Logistic回归分类算法并给出伪代码,Python代码实现。 (说明:从本文开始,将接触到最优化算法相关的学习。旨在将这些最优化的算法用于训练出一个非线性的函数,以用于分类。)算法原理 首先要提到的概念是回归。 对于回归这个概念,在以后的文章会有系...
分类:
编程语言 时间:
2014-12-30 13:29:14
阅读次数:
615
基于信息检索课程,完成实现了一个文本分类系统,现记录一下整个实现过程。
文本分类以文本数据为分类对象,本质上是机器学习方法在信息检索领域的一种应用,可以继承机器学习领域的很多概念和方法,但同时也需要结合信息检索领域的特点进行处理。主要研究的方向是:文本分词方法、文本特征提取方法、分类算法。
本人主要使用了5种常用的分类算法,分别是kNN、Rocchio、NBC、SVM和ANN,对每种算法的结果...
分类:
其他好文 时间:
2014-12-29 16:49:34
阅读次数:
185
R语言:利用caret包中的dummyVars函数进行虚拟变量处理
dummyVars函数:dummyVars creates a full set of dummy variables (i.e. less than full rank parameterization----建立一套完整的虚拟变量...
分类:
编程语言 时间:
2014-12-29 12:07:27
阅读次数:
1133
斯坦福NG机器学习听课笔记-推荐系统(recommender system),NG从电影评级简单例子开始讲,把推荐系统中概念与核心算法(协同过滤)都有清晰的描述。...
分类:
其他好文 时间:
2014-12-29 10:28:57
阅读次数:
237