util里提供了create_voc_step0用于批量生成features并保存,create_voc_step1读入features再生成聚类中心,比较适合大量语料库聚类中心的生成。 提取一张图的特征如下: 第一行是文件头,分别用32bit表示特征来自几张图(1)、特征描述子长度(128bit, ...
分类:
数据库 时间:
2018-03-13 14:03:58
阅读次数:
2014
前人摘树,后人乘凉。 源码在github有CMakeLists,代码下下来可以直接编译。 泡泡机器人有个很详细的分析,结合浅谈回环检测中的词袋模型,配合高翔的回环检测应用,基本上就可以串起来了。 tf-idf的概念,表达方式不唯一,这里的定义是这样: tf表示词频,这个单词在图像中出现的次数/图像单 ...
分类:
数据库 时间:
2018-02-15 10:29:47
阅读次数:
869
目录 前言 1、Eigen线性代数库的安装 2、Sophus李代数库的安装 3、OpenCV计算机视觉库的安装 4、PCL点云库的安装 5、Ceres非线性优化库的安装 6、G2O图优化库的安装 7、Octomap八叉树地图库的安装 8、DBoW3词袋模型库 目录 前言 1、Eigen线性代数库的安 ...
分类:
其他好文 时间:
2018-01-07 14:14:16
阅读次数:
2613
在深度学习在图像识别任务上大放异彩之前,词袋模型Bag of Features一直是各类比赛的首选方法。首先我们先来回顾一下PASCAL VOC竞赛历年来的最好成绩来介绍物体分类算法的发展。 从上表我们可以发现,在2012年之前,词袋模型是VOC竞赛分类算法的基本框架,几乎所有算法都是基于词袋模型的 ...
分类:
其他好文 时间:
2017-12-24 11:11:20
阅读次数:
279
http://blog.csdn.net/pipisorry/article/details/41957763 文本特征提取 词袋(Bag of Words)表征 文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长 ...
分类:
其他好文 时间:
2017-11-12 13:31:59
阅读次数:
227
简介一 切词二 去除停用词三 构建词袋空间VSMvector space model四 将单词出现的次数转化为权值TF-IDF五 用K-means算法进行聚类六 总结简介查看百度搜索中文文本聚类我失望的发现,网上竟然没有一个完整的关于python实现的中文文本聚类(乃至搜索关键词python 中文文... ...
分类:
其他好文 时间:
2017-11-11 11:44:06
阅读次数:
237
前段时间做了一个车型识别的小项目,思路是利用k-means算法以及词袋模型来做的。 近年来图像识别的方法非常非常多,这边只记录一下我那个项目的思路,核心思想是k-means算法和词汇树。 很遗憾没有做详尽的开发前的思路文档,只能按照记忆进行大致总结。 项目分为三大模块:特征点抽取、训练词汇树、识别( ...
分类:
编程语言 时间:
2017-11-07 13:26:07
阅读次数:
146
在图像检索中,如果使用词袋模型,来进行图像特征的表示,可以将信息检索中的倒排索引的结构引进过来。 文档:相当于是一张图像中的所有特征向量的集合。 单词:相当于是图像表示中的一个特征向量。 当然,具体进行操作的时候,已经进行了最近邻的处理了。 接下来就可以使用相关的概念进行等价的处理了。 其中,倒排索 ...
分类:
其他好文 时间:
2017-10-31 14:16:19
阅读次数:
226
在介绍朴素贝叶斯分类之前,首先介绍一下大家都比较了解的贝叶斯定理,即已知某条件概率,如何得到两个时间交换后的概率, 也就是在已知P(A|B)的情况下如何求得P(B|A)?可以通过如下公式求得: 而朴素贝叶斯分类是一种简单的分类算法,称其朴素是因为其思想基础的简单性:就文本分类而言,它认为词袋中的两两 ...
分类:
编程语言 时间:
2017-10-15 14:13:28
阅读次数:
233
经济学相关资料供内部教学使用,不得外传,看完删掉. 经济学概念词袋100.201709 经济本质和投资思考类.201709 ...
分类:
其他好文 时间:
2017-09-25 16:09:42
阅读次数:
97