基于信息检索课程,完成实现了一个文本分类系统,现记录一下整个实现过程。
文本分类以文本数据为分类对象,本质上是机器学习方法在信息检索领域的一种应用,可以继承机器学习领域的很多概念和方法,但同时也需要结合信息检索领域的特点进行处理。主要研究的方向是:文本分词方法、文本特征提取方法、分类算法。
本人主要使用了5种常用的分类算法,分别是kNN、Rocchio、NBC、SVM和ANN,对每种算法的结果...
分类:
其他好文 时间:
2014-12-29 16:49:34
阅读次数:
185
网上去找关于HOG的资料,发现理解性的较少,并且较为冗长,为方便大家理解便自己写了篇,希望能对奋斗在特征提取第一线的同志们有所帮助:HOG即histogram of oriented gradient, 是用于目标检測的特征描写叙述子,该技术将图像局部出现的方向梯度次数进行计数,该方法和边缘方向直方...
分类:
其他好文 时间:
2014-12-25 11:14:05
阅读次数:
145
已有 9450 次阅读?2012-3-15 20:50?|系统分类:科研笔记|关键词:opencv 轮廓 轮廓的查找、表达、绘制、特性及匹配(How to Use Contour? Find, Component, Construct, Features & Match)?? 作者:王先荣 前言 ...
分类:
其他好文 时间:
2014-12-19 22:09:18
阅读次数:
250
行为识别特征提取综述摘要 人体行为识别目前处在动作识别阶段,而动作识别可以看成是特征提取和分类器设计相结合的过程。特征提取过程受到遮挡,动态背景,移动摄像头,视角和光照变化等因素的影响而具有很大的挑战性。本文将较全面的总结了目前行为识别中特征提取的方法,并将其特征划分为全局特征和局部特征,且分开介....
分类:
其他好文 时间:
2014-12-19 17:15:26
阅读次数:
308
引子
要进行人脸的识别,尤其是复杂环境下的人脸识别,就要在捕获人脸图像之后对图像进行预处理的工作,如图像的大小和灰度的归一化,头部姿态的矫正,图像分割等。这样做的目的是改善图像质量,消除噪声,统一图像灰度值及尺寸,为后序特征提取和分类识别打好基础。
该文将就人脸的剪切和归一化操作进行学习探讨,并做一笔记备用。
具体步骤
由于opencv的人脸识别需要输入图片具有相同的尺寸和灰度...
分类:
其他好文 时间:
2014-12-17 22:44:32
阅读次数:
318
文本特征提取
词袋(Bag of Words)表征
文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长度的数值特征向量而不是不同长度的文本文件。为了解决这个问题,scikit-learn提供了一些实用工具可以用最常见的方式从文本内容中抽取数值特征,比如说:
标记(tokenizing)文本以及为每一...
分类:
其他好文 时间:
2014-12-16 11:46:54
阅读次数:
203
HOG(Histograms of Oriented Gradients)特征是Dalal于2005年针对行人检测问题提出的特征,能够大体描述行人的轮廓[12]。HOG特征是目前行人检测领域最常用的特征。对于其它非行人目标的检测,HOG特征也取得了突出效果,可以说是目标检测邻域,单一特征中效果最好的特征[26]。此外,HOG特征还被应用到姿态估计[62],人脸识别[63],表情识...
分类:
其他好文 时间:
2014-12-08 19:43:32
阅读次数:
331
原始特征的数量可能很大,或者说样本是处于一个高维空间中,通过映射或变换的方法,降高维数据降低到低维空间中的数据,这个过程叫特征提取,也称降维。 特征提取得基本任务研究从众多特征中求出那些对分类最有效的特征,从而实现特征空间维数的压缩。传统的降维技术可以分为线性和非线性两类。(1)线性降维算法主要有P...
分类:
其他好文 时间:
2014-12-06 20:14:58
阅读次数:
234
特征提取SURF特征:http://www.vision.ee.ethz.ch/software/index.de.html(当然这只是其中之一)LBP特征(一种纹理特征):http://www.comp.hkbu.edu.hk/~icpr06/tutorials/Pietikainen.htmlF...
分类:
其他好文 时间:
2014-12-02 22:05:30
阅读次数:
318
引自:http://cvchina.net/post/50.html一、特征提取Feature Extraction: SIFT [1] [Demo program][SIFT Library] [VLFeat] PCA-SIFT [2] [Project] Affine-SIFT [3] [Pro...
分类:
其他好文 时间:
2014-12-02 22:04:44
阅读次数:
413