标签:
第二章是数字图像及其性质,开篇介绍了一些基本概念和数学工具。
首先提出了一个问题,那就是透视投影,在将3D的物体经过透视投影和转化为2D图像时,损失了大量的信息,所以通过一幅图像重构3D场景就成为了一个病态的问题。
在数学知识部分,涉及到了很多接触过但未深入了解的和从未接触过的知识点。首先是理想冲激,狄拉克分布,可以进行图像的采样。从网上找了一个相关的笔记 http://www2.math.uu.se/~maciej/courses/PDE_for_Finance/SP2013.pdf
随后是对卷积的理解,之前有知道卷积的概念和计算,这一次结合图像和一些实例了解了卷积的具体含义,知乎中举的例子个人感觉挺好的解释了卷积的含义,在书中主要涉及的是二维的卷积,附知乎链接https://www.zhihu.com/question/22298352?rf=21686447。
再然后就是傅里叶变换了,一直对这个词避之不及,感觉特别复杂特别难懂,之前学偏微分方程的时候也只是死记硬背,会计算就好了,这一次才认真地回顾了一下课本。傅里叶级数是对函数的一种近似方式,与泰勒展开相比,傅里叶级数对函数的要求更少一点,利用三角函数去近似。由于傅里叶级数是针对周期函数进行的,对于非周期函数只能假设函数有周期,再令周期趋向于无穷,这个时候级数转化成了积分形式,二重积分内层称为傅里叶变换,外层成为傅里叶逆变换。虽然具体的推导和性质还没有一一尝试,但之后在接触实例之后慢慢去补。
作为随机过程的图像,没有学过随机过程,就只是简单的补了一下熵的相关知识,之后涉及到再补相关知识。
数字图像有很多特性,其中之一就是距离(distance),想起了当时计算所笔试时候考的距离,常用的距离有欧氏距离(Euclidean distance),DE[(i,j),(h,k)]=sqrt((i-h)^2+(j-k)^2),城市距离(city block)D4[(i,j),(h,k)]=|i-h|+|j-k|,棋盘距离(chessboard)D8[(i,j),(h,k)]=max(|i-h|,|j-k|)。
一些基本的概念:连通——像素之间存在路径;外边界——区域的补集的边界;边缘——一个像素与其领域的局部性质;包含图像边界的连续区域的连通子集合为背景;补集的其他部分称为孔;凸包——包含物体的最小区域;湖——被物体所包围;海湾——与物体凸包的边界相连。
图像视觉感知的一些特性:1、对比度(contrast)2、敏锐度(acuity)3、物体边界(object border)4、色彩(color)
图像噪声:1、白噪声,特例是高斯噪声;2、加性噪声;3、乘性噪声;4、量化噪声;5、冲激噪声(胡椒盐噪声)。
相关Matlab知识点:rgb2gray、im2bw、bwdist
标签:
原文地址:http://www.cnblogs.com/blueprintf/p/5887095.html