学习 machine learning 的最低要求是什么? 我发觉要求可以很低,甚至初中程度已经可以。 首先要学习一点 Python 编程,譬如这两本小孩子用的书:【1】【2】便可。 数学方面,只需要知道「两点间距离」的公式(中学的座标几何会读到)。这本书第二章介绍 kNN 算法,包括 Pytho....
分类:
编程语言 时间:
2015-05-17 21:27:52
阅读次数:
260
这里模仿了Word2vec里面构建Hash索引的思想。#include
#include
#include
#include
#include
#include
#include
#define MaxString 50
#define MaxUserSi...
分类:
编程语言 时间:
2015-05-11 16:10:04
阅读次数:
148
# 使用好任何机器学习算法的前提是选好Features
from numpy import *
import operator
from os import listdir
def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0]
diffMat = tile(inX, (dat...
分类:
编程语言 时间:
2015-05-10 09:56:10
阅读次数:
202
其中的数据格式:
一行一个用户购买记录,uid pid1 pid2…#include
#include
#include
#include
#include
#include
#include
#define MaxString 50
#define M...
分类:
编程语言 时间:
2015-05-07 16:46:16
阅读次数:
209
k近邻(k-NearestNeighbor)算法简称kNN。基本思想简单直接,对于一个需要分类的数据实例x,计算x与所有已知类别的样本点在特征空间中的距离。取与x距离最近的k个样本点,统计这些样本点所属占比最大的类别,作为x的分类结果。下图中与绿色点最近的3个点中,2个属于红色类别,则认为x属于红色...
分类:
其他好文 时间:
2015-05-07 15:48:07
阅读次数:
140
模板匹配
什么才是描述像不像的最直白简单的算法——KNN
什么才是学习出最贴近人的认知的模板匹配算法——KMEAN?KMEDOID?or other clustering methods?
什么样的结构最贴近人的认知
生成模型进化 -> 生成+判别模型
判别模型应该只是一种认知的一种,不是认知的全部,认知的全部应该是有概念的,但是判别模型却没法体现这一点
但是并不是说有...
分类:
其他好文 时间:
2015-04-27 18:29:49
阅读次数:
171
本实验的目的是学习Parzen窗估计和k最近邻估计方法。在之前的模式识别研究中,我们假设概率密度函数的参数形式已知,即判别函数J(.)的参数是已知的。本节使用非参数化的方法来处理任意形式的概率分布而不必事先考虑概率密度的参数形式。在模式识别中有躲在令人感兴趣的非参数化方法,Parzen窗估计和k最近邻估计就是两种经典的估计法。这里使用Matlab实现这两种估计方法。...
分类:
其他好文 时间:
2015-04-25 22:54:04
阅读次数:
1933
留学韩国,本来想继续在研究生这条路上一直走到黑的,奈何时间不够,口袋里面的银子总是不够用,
研究的东西也是浅尝辄止,
没办法匆匆写了篇论文交了就毕业了,一声长叹,想想求学二十余载,总是感觉什么都不够用,尤其是脑子,
有时甚至忘了带上
研究室生活也是张弛无度
决定出去工作了,但是在此之前简单的把研究的内容整理下,
权当是抛砖引玉,忘别见此笑话,
以后的内容会偏及数据防护DLP
领域<...
分类:
其他好文 时间:
2015-04-25 00:17:47
阅读次数:
195
特征集分析
数据集为letter-recognition.data,一共为20000条数据,以逗号分隔,数据实例如下所示,第一列为字母标记,剩下的为不同的特征。
T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8
学习方法
1、读入数据,并去除分隔号2、将数据第一列作为标记,剩下的为训练数据3、初始化分类器并利用训练数据进行训练4、利用测试数据验证准确率...
分类:
编程语言 时间:
2015-04-20 15:01:11
阅读次数:
427