JAVA 并发 java的并行编程比较复杂,我也理解不深。但是最近由于要并行训练分类器,琢磨了一点,有错误请指正。只是大体介绍一下而已。 很多问题我们使用顺序编程便可以解决,但是有些问题如果能够使用多线程并行的执行其中的任务则可以很大程度的提高时间效率,所以多线程还是很有必要的。 我自己...
分类:
编程语言 时间:
2014-09-01 22:29:53
阅读次数:
382
1.调用庖丁分词器,分词grid@server01:~/data$hadoopjarmrtokenize.jartokenize.TokenizeDriver/home/grid/data/lesson8/home/grid/output/sportwords14/08/3121:59:33INFOinput.FileInputFormat:Totalinputpathstoprocess:10205.....14/08/3122:05:25INFOmapred.JobClient:Map..
分类:
其他好文 时间:
2014-09-01 15:48:44
阅读次数:
296
槽填充中模式优化方法的研究(硕士毕业论文) 沈晓卫针对槽填充任务的实现方法 主要可以分为三种: 第一种是把槽填充任务转换为关系抽取任务,用传统的信息抽取方法来实现槽填充任务,按照具体实现方法的不同,信息抽取方法又可以分为模式匹配的方法和基于分类器的方法 第二种是以问答系统(Question...
分类:
其他好文 时间:
2014-09-01 15:15:33
阅读次数:
234
QDF假设样本符合高斯分布,通过估计均值与协方差矩阵,训练分类器。但是由于特征维数较高,时空复杂度较高。(协方差矩阵的维数为 特征维数*特征维数)。而且协方差矩阵往往存在不满秩无法求逆的情况(样本数《特征维数)。MQDF主要有以下改进:1、在协方差矩阵的对角线上加一个小的常量,保证矩阵的满秩(非奇异...
分类:
其他好文 时间:
2014-08-31 13:05:31
阅读次数:
241
对于事件A和事件B同时出现的,一种信息论的描述方法就是互信息,计算方式如下其意义:由于事件A发生与事件B发生相关联而提供的信息量。在处理分类问题提取特征的时候就可以用互信息来衡量某个特征和特定类别的相关性,如果信息量越大,那么特征和这个类别的相关性越大。反之也是成立的。以搜狗实验室的语料为例。选取金...
分类:
其他好文 时间:
2014-08-31 01:38:40
阅读次数:
205
个人接触机器视觉的时间不长,对于机器学习在目标检测的大体的框架和过程有了一个初步的了解,不知道对不对,如有错误,请各位大牛不吝指点。目标的检测大体框架:目标检测分为以下几个步骤:1、训练分类器所需训练样本的创建: 训练样本包括正样本和负样本;其中正例样本是指待检目标样本(例如人脸或汽车等),负样本指...
分类:
其他好文 时间:
2014-08-31 01:36:30
阅读次数:
269
初始的想法就是,结合不同的分类算法来给出综合的结果,会比较准确一些 称为ensemble methods or meta-algorithms,集成方法或元算法 集成方法有很多种,可以是不同算法之间的,也可以是同一个算法但不同参数设置之间的,也可以是将数据集分成多分给不同的分类器之间的 总的来说,有...
分类:
其他好文 时间:
2014-08-28 12:58:39
阅读次数:
366
第二章 感知机感觉感知机这东西还是很简单的,随便写点。感知机(perceptron)是二分类的线性分类器。输入x表示实例的特征向量,输出y为实例的类别,由如下函数表示: 其中w为权值(weight)或权值向量(weight vector),b表示偏置(bias),sign为符号函数,里面的东西大于....
分类:
其他好文 时间:
2014-08-27 20:21:48
阅读次数:
241
AdaBoost算法 基本思想是,对于一个复杂的问题,单独用一个分类算法判断比较困难,那么我们就用一组分类器来进行综合判断,得到结果,“三个臭皮匠顶一个诸葛亮” 专业的说法, 强可学习(strongly learnable),存在一个多项式算法可以学习,并且准确率很高 弱可学习(weakly lea...
分类:
其他好文 时间:
2014-08-26 17:06:26
阅读次数:
247
Boosting简单介绍分类中通常使用将多个弱分类器组合成强分类器进行分类的方法,统称为集成分类方法(Ensemble Method)。比較简单的如在Boosting之前出现Bagging的方法,首先从从总体样本集合中抽样採取不同的训练集训练弱分类器,然后使用多个弱分类器进行voting,终于的结果...
分类:
其他好文 时间:
2014-08-24 10:16:42
阅读次数:
199