标签:
论文地址:链接: http://pan.baidu.com/s/1kTAcP8r 密码: djm4
这是一篇可手持单目相机进行定位与制图方法的文章。它与传统slam的方法不一致的地方在于将定位跟踪与制图分离出了两个单独过程。
双线程机制: 一个线程用于鲁棒跟踪手持相机运动,另一个线程用于从之前观测到的视频帧中产生三维地图点特征 。 系统允许batch techniques复杂的计算,但不在实时操作下。。
这篇文章的研究目的是: 不需要任何模板与初始目标,跟踪校正的手持相机,并且绘制环境地图。
传统的单目slam是制图与定位有着必然的联系,每个单帧图像的加入都要有更新。 跟踪机器人的有里程辅助,而且可以减慢机器人的运动。
但针对手持的会存在两问题:一是没有上面两条件,二是存在数据相关性(data-association errors),三是增量式系统带入不可挽回的恶化效应。
避免数据相关性误差,采取主动搜索的方式(covariance-driven gating)binary inlier/outlier rejection with Joint Compatibility Branchand Bound or Random Sample Consensus (RANSAC) 。保证数据正确匹配。
跟踪与制图分离跟踪不在依赖于制图过程,很多鲁棒的跟踪方法可以使用,跟踪与制图间的数据相关性不共享。释放了地图更新的计算负担。
分离后,没必要每帧都地图更新,主要集中在少量的有用关键帧,处理过程的完成只需要在下帧加入时完成即可--》使得图像更新周期长,预留给地图更新算法的时间足够长,可用于操作大尺寸地图。
所以可以选用大计算但精度与鲁棒性高的方法。
-------------------------------------------------补------------------------------------------------------------------------------------------------
关于sba(sparse
bundle adjustment)的30个常见问题
Q2 -- 什么是光束法平差? 假设给定一系列图像中观测到的一组对应点集相应的三维坐标的初始估计,以及关于每张图像的viewing参数的初始估计。光束法平差(BA)是一个大的最优化的问题,包括同时精化三维结构和viewing参数(即相机姿态和可能的本征校准和径向畸变),为了获得一个在特定的假设下最优化的重建,考虑与观测的图像特征有关的噪声:如果图像误差满足均值为零的正态分布,那么BA是最大似然法估计。它的名字“bundles”(光束)源于每个三维特征聚焦于每个相机的光学中心,这些光学中心相对于结构和viewing参数进行最优化的调整。sba使用Levenberg-Marquardt非线性最小二乘算法的常规实现来解决与BA相联系的稀疏的大规模的优化问题。-------------------------------------------------------------------------------------------------------------------------------------------------
调整 offline Structure-from-Motion (SfM) ,实时视觉里程计论文参考[20, 18, 9].,利用五点立体点对建立初始地图,随着N个最近相机点的加入,利用局部光束平差的方法进行建图。此文采用的是立体初始化和偶尔局部光束更新,不同之处是想建立长期的地图,里面的特征时常被再次观测到,采用计算量大的全地图优化的方式。
光束采用极线搜索的方式初始化特征而非long 2D feature tracks 。。
每个关键帧存在四个尺度的金字塔中。零层放原始图 640*480 --> 第三层 80*60 (下采样)
构成特征的像素都不是独自存储的,每个点特征都包含一个源关键帧(第一次观测到的关键帧),在源金字塔层,patches对应8x8 像素块。
In the examples shown later the map might contain some M=2000 to 6000 points andN=40 to 120 keyframes.
The camera delivers 640×480 pixel YUV411 frames at 30Hz.
在金字塔每层提取 FAST 角点
针孔相机投影几何模型。
u 包含旋转与平移的六自由度信息。
为在当前帧中找到地图中的点p,围绕预测图片前后固定范围的图片进行搜索。搜索前需根据视场改变进行调整,
依据当前帧与第一次观测帧得到仿射变换 A
{us,
vs} correspond to horizontal and vertical pixel displacements in the patch’s source pyramid level, and {uc,
vc} correspond
to pixel displacements in the current camera frame’s zeroth (fullsize) pyramid level.
矩阵A
决定哪层金字塔将会被搜索。
patch
search and pose update are done twice.
The final frame pose is calculated from both coarse and fine sets of image measurements together.
跟踪系统在每帧评估跟踪质量:成功观测到的特征作为分数
fraction低于某阈值认为跟踪丢失,启动跟踪恢复过程初始化。
目前理解只能到这层面了,有新理解再更新.欢迎指正.
版权声明:本文为博主原创文章,未经博主允许不得转载。
【论文学习记录】PTAM:Parallel Tracking and Mapping for Small AR Workspaces
标签:
原文地址:http://blog.csdn.net/zyh821351004/article/details/47617379