KNN是最简单的机器学习算法之一。在模式识别中,K-近邻算法(或近邻的简称)是一种用于分类和回归的非参数方法。[1]在这两种情况下,输入包含k个最近的训练样本在特征空间中。输出取决于近邻是用于分类或回归:l在kNN分类中,输出的是一个分类的关系。一个对象是由其邻居投票进行分类,被分类到最近的K个最近...
分类:
编程语言 时间:
2015-05-18 16:30:21
阅读次数:
781
想用机器学习的方法,那么思路其实也很明确,问题是那一天用户是买还是不买,那么可以看成是二分法。通过用户行为方式来判断是否会购买。就是把用户行为等抽象成特征向量得到训练集,扔进机器学习算法训练出一个模型,然后用测试集预测出结果。虽然机器学习的算法有不少,而且需要不断的调整参数和优化,但是我认为特征向量的选取才是最关键的,很显然我们到最后也没搞好~~~...
分类:
移动开发 时间:
2015-05-17 12:20:50
阅读次数:
155
通用机器学习MLlib in Apache Spark—Spark中的分布式机器学习程序库Mahout—分布式的机器学习库Stanford Classifier—斯坦福大学的分类器Weka—Weka是数据挖掘方面的机器学习算法集。ORYX—提供一个简单的大规模实时机器学习/预测分析基础架构。数据分析...
分类:
其他好文 时间:
2015-05-15 19:20:34
阅读次数:
241
一、复杂网络中的一些基本概念
1、复杂网络的表示
在复杂网络的表示中,复杂网络可以建模成一个图,其中,表示网络中的节点的集合,表示的是连接的集合。在复杂网络中,复杂网络可以是无向图、有向图、加权图或者超图。
2、网络簇结构
网络簇结构(network cluster structure)也称为网络社团结构(network
community structure),是复杂...
分类:
编程语言 时间:
2015-05-15 13:42:42
阅读次数:
178
# 使用好任何机器学习算法的前提是选好Features
from numpy import *
import operator
from os import listdir
def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0]
diffMat = tile(inX, (dat...
分类:
编程语言 时间:
2015-05-10 09:56:10
阅读次数:
202
Weka是一款使用Java语言编写的数据挖掘机器学习软件,是GNU协议下分发的开源软件。Weka提供了一整套完整的数据处理工具,学习算法和评价方法,包含数据可视化的图形用户界面。
Weka系统汇集了最前沿的机器学习算法和数据预处理工具,它包含处理标准数据挖掘问题的所有方法:回归,分类,聚类,关联规则以及属性选择。
在进行安装之前,首先要到官网上去下载weka安装文件。
下载地址:http://...
分类:
其他好文 时间:
2015-05-08 18:16:11
阅读次数:
168
一、因子分解机FM的模型
因子分解机(Factorization Machine, FM)是由Steffen
Rendle提出的一种基于矩阵分解的机器学习算法。
1、因子分解机FM的优势
对于因子分解机FM来说,最大的特点是对于稀疏的数据具有很好的学习能力。现实中稀疏的数据很多,例如作者所举的推荐系统的例子便是一个很直观的具有稀疏特点的例子。
2、因子分解机FM的...
分类:
编程语言 时间:
2015-05-06 15:14:20
阅读次数:
222
SVM上:这个算法应该是机器学习这门课里最重要的部分了。 首先是SVM的思想:找到超平面,将两类中距离最近的点分的越开越好(直至二者相等)。 然后是函数间隔和几何间隔的定义,二者之间的区别。 接着是超平面模型的建立,看看它是如何将问题转化为凸优化问题的。 SVM第一个...
分类:
编程语言 时间:
2015-05-06 10:30:01
阅读次数:
167
感知机:这是最简单的一个机器学习算法,不过有几点还是要注意一下。 首先是损失函数的选取,还有为了使损失函数最小,迭代过程采用的梯度下降法,最后得到最优的w,b 直观解释就是,调整w,b的值,使分离超平面向误分类点移动,以减小误分点与超平面的距离,直至超平面 ...
分类:
编程语言 时间:
2015-05-05 10:24:34
阅读次数:
135
朴素贝叶斯:有以下几个地方需要注意:1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单词出现的次数。2. 计算公式如下:其中一项条件概率可以通过朴素贝叶斯条件独立展开。要注意一点就是的计算方法,而由...
分类:
编程语言 时间:
2015-05-03 11:52:54
阅读次数:
248