数字图像处理学习总结

这个学期学习了数字图像处理这门课程，主要学习了图像的点运算、几何变换、空间域图像增强、频率域图像增强、形态学图像处理、图像分割（边缘检测）、纹理方向等方面的知识。

（1）图像的点运算。

1灰度直方图

灰度直方图描述了一幅图像的灰度级统计信息，一般用于图像分割和图像灰度变换等的处理过程中。

从数学角度来说，图像直方图描述图像各个灰度级的统计特征，它是图像灰度级的函数，统计一幅图像中各个灰度级出现的次数或频率。

从图形上来说，灰度直方图是一个二维图，横坐标为图像中各个像素的灰度级别，纵坐标表示具有各个灰度级别的像素在图像中出现的次数或频率。

2直方图的均衡化

直方图均衡化是将原图像通过某种变换，得到一幅灰度直方图为均匀分布的新图像的方法。

从人眼视觉特性来考虑，一幅图像的直方图如果是均匀分布的，即Ps(s)=k(归一化时k=1)时，该图像色调给人的感觉比较协调。因此将原图像直方图通过T(r)调整为均匀分布的直方图，这样修正后的图像能满足人眼视觉要求。

因为归一化假定

两边积分得

上式表明，当变换函数为r的累积直方图函数时，能达到直方图均衡化的目的。

对于离散的数字图像，用频率来代替概率,则变换函数T(rk)的离散形式可表示为:

直方图均衡化的步骤：

（1）求原直方图。

（2）求累加值（原直方图）

（3）将累加值乘以255

（4）变换

3直方图规定化

直方图规定化增强处理的步骤如下：

①对原始图像作直方图均衡化处理；

②按照希望得到的图像的灰度概率密度函数pz(z)，求得变换函数G(z)；

③用步骤①得到的灰度级s作逆变换z= G-1(s)。

经过以上处理得到的图像的灰度级将具有规定的概率密度函数pz(z)。

4灰度变换

线性灰度变换函数是一个一维线性函数：

式中参数为线性函数的斜率，为线性函数在轴的截距，表示输入图像的灰度，表示输出图像的灰度。其中：

5灰度拉伸分段线性变换

利用分段线性变换函数来增强图像对比度的方法实际上是增强原图各部分的反差，即增强输入图像中感兴趣的灰度区域，相对抑制那些不感兴趣的灰度区域。分段线性变换的函数表达式：

式中最重要的参是，，。

分段的灰度拉伸可以对灰度图像的灰度值进行拉伸和压缩。如果一幅图像灰度集中在较暗的区域而导致图像偏暗，我们可以用灰度拉伸功能来扩展物体灰度区间以改善图像；反过来，如果一幅图像灰度集中在较亮的区域而导致图像偏亮，可以用灰度压缩功能来扩展物体灰度区间以改善图像质量。
（2）图像的几何变换

在数字图像处理中，为了更好的对图像进行处理和识别，有时对图像进行一些几何变换是必要的，比如图像旋转、图像缩放、图像平移等。

几何变换是不改变图像的像素值，只是在图像平面进行像素的安排。其运算包括两点：一是空间变换所需的运算；二是还需要使用灰度插值算法，由于在变换的过程中输出图像的像素课映射到输入图像的非整数坐标上。

设原图像经过几何变换产生的目标像素为，则该空间变换关系可表示为：

其中和为由到的坐标变换函数。

1图像平移

设为原图像上的一点，图像的水平平移量为，垂直平移量为，则平移之后的点坐标变为：

用矩阵表示为：

对变换矩阵求逆，可以得到逆变换为：

即

平移后的目标图像中的每一点都可以在原图像中找到对应的点。如新图像中的一个像素，可以求出对应原图中的像素。

2图像缩放

图像缩放就是图像的缩小和放大，指图像大小按照指定的比率放大或者缩小，假设图像轴方向的缩放比率，轴方向的缩放比率，则缩放变换公式为：

其逆运算为：

直接用缩放公式计算得到的目标图像中，某些映射源坐标可能不是整数，从而找不到对应的像素位置，这个时候我们就要用插值算法来处理，一般来说，对图像缩小的采用最近邻插值，对图像放大的采用双线性插值算法。

3图像旋转

图像的旋转中以原点为中心的图像旋转。点绕原点逆时针旋转角度到点，有旋转公式为：

其逆变换运算为

最近邻插值：

双线性插值：

输出像素的值为输入图像中离它最近的邻域内采样点像素的灰度值的加权平均。设已知单位正方形的顶点坐标分别为

数字图像处理学习总结

我们通过双线性插值得到正方形内任意点的值。

首先对上端的两个点进行双线性插值得到：

再对下端的两个顶点进行双线性插值得到：

最后，对垂直方向进行双线性插值得到：

结合上面的两式，最后得到：

（2）空间域图像增强

空域滤波是在图像空间中借助模板进行的邻域操作完成。用模板在图像上平滑操作，逐点移动模板，对每一个点，滤波器在该点的响应通过事先定义的关系来计算。

数字图像处理学习总结

空域滤波原理

1对于线性空域滤波，用系数和滤波模板扫过的区域的相应像素值做卷积而得到，在图像处的响应值为：

将的值作为图像在位置的灰度值。

2中值滤波器

中值滤波器是一种非线性滤波器，在一定条件下线性滤波器如平均值滤波器所带来的图像细节模糊问题，对于过滤脉冲干扰及图像扫描噪声有效，但是对点、线、尖顶的图像不宜采用中值滤波的方法。

中值滤波是用一个奇数点的滑动窗口，将窗口中心点的值用窗口各点的中值代替。操作如下：

1）将模板在图像中移动，并将模板中心与图中某个像素位置重合。

2）读取模板下各对应像素的灰度值。

3）将这些灰度值从小到大排成1列。

4）找出这些灰度值排在中间的1个。

5）将这个中间值赋给对应模板中心位置的像素。

3图像锐化

在图像传输和变换的过程中，因受到干扰会退化，比较典型的是图像模糊，图像锐化就是是边缘和模糊的图像变得清晰，使其细节更加清晰。我们用的是微分算子。

主要用梯度算子的方法。对图像，在其点上的梯度可以定义一个二维列向量：

模为

梯度的方向为

对一幅图像，常用的微分算子有

1）Roberts算子：

和

Roberts算子

2）Sobel算子：对一个点

在梯度锐化时，我们是用模板运算，即用Sobel算子模板运算。

Sobel算子水平 Sobel算子垂直

（5）形态学图像处理

通过形态学处理不但可以过滤由于噪音或者其他原因引起的一些较小的不可能为人脸的类肤色区域，减少候选区域和提高检测速度，而且可以填补肤色区域内的较小空洞，防止这些空洞被误认为是人脸器官所造成的，为后续检测区域内(欧拉数判断是否为候选区域)降低了误判的可能性。

（6）边缘检测

边缘检测常用算子：

基于一阶微分的边缘检测方法：

1Roberts 算子考虑图像的2*2邻域，是最简单的边缘检测算子，算法过程简述：

1），遍历图像（除去上边缘和左边缘），对每个像素做Roberts模板运算。

2），将结果保存到目标图像，结束。

2Sobel算子考察的是3*3邻域，由两个卷积核组成，见上图，算法过程简述：

1），遍历图像（除去边缘，防止越界），对每个像素做Sobel模板卷积运算。

2），比较两个计算结果的大小，取较大者复制到目标图像，结束。

3Prewitt算子和Sobel算子类似，所不同的是选用不同的模板而已，算法过程相同。Krisch算子同样考究3*3邻域，所不同的是选用了八个卷积核，见上图，算法过程简述：

1），遍历图像（除去边缘，防止越界），对每个像素做Krisch模板卷积运算。

2），比较八个计算结果的大小，取较大者复制到目标图像，结束。

基于二阶微分的边缘检测方法

两种Laplacian模板

Gauss-Lanlancian算子

Laplacian 算子是二阶导数边缘算子，考察的是3*3邻域，上图是两种比较常用的模板，算法简述如下：

1），遍历图像（除去边缘，防止越界），对每个像素做Laplancian模板卷积运算，注意是只做其中的一种模板运算，并不是两个。

2），复制到目标图像，结束。

Gauss-Laplacian考察的是5*5的邻域，检测的同时，引入了滤波，是噪声得以平滑，上图是一种常用的算子，算法简述。

1），遍历图像（除去边缘，防止越界），对每个像素做Gauss -Laplancian模板卷积运算。

1），复制到目标图像，结束。

Canny边缘检测是非常重要的一种边缘检测算法，主要过程如下：

1），用高斯滤波器平滑图像。

已经学习过，根据高斯函数，构造高斯模板，进行滤波，不在赘述。

2），用一阶偏导的有限差分来计算梯度的幅值和方向；

计算梯度作用模板，遍历像素，进行模板运算即可。

幅值和方向：

其中，Phi 表示是幅值，Theta 是方向，用图像副本进行保存。

3），对梯度幅值进行非极大值抑制；

为确定边缘，必须保留局部梯度最大的点，而抑制非极大值（NMS）。

图象处理中的边缘检测------canny算子（图五）
解决办法是，利用梯度的方向：

已经求出Theta 的值，梯度的方向用于非极大值的抑制，将梯度角离散化到0,1，2，3中的一个（通过线性映射），采用近似的算法。知道了梯度角，也就知道了梯度线方向。

邻域的中心像素M与沿着梯度线的两个像素相比。如果M的梯度值不比沿梯度线的两个相邻像素梯度值大，则令M=0。

4），用双阈值算法检测和连接边缘。

减少假边缘段数量的典型方法是对N[i，j]使用一个阈值。将低于阈值的所有值赋零值。但问题是如何选取阈值？

解决方法：

双阈值算法。双阈值算法对非极大值抑制图象作用两个阈值τ1和τ2，且2τ1≈τ2，从而可以得到两个阈值边缘图象N1［i,j］和N2［i，j］。由于N2［i，j］使用高阈值得到，因而含有很少的假边缘，但有间断(不闭合)。双阈值法要在N2［i，j］中把边缘连接成轮廓，当到达轮廓的端点时，该算法就在N1［i,j］的8邻点位置寻找可以连接到轮廓上的边缘，这样，算法不断地在N1［i,j］中收集边缘，直到将N2［i,j］连接起来为止。

第二篇：数字图像处理总结简答

12 简单叙述傅里叶变化的5个性质，对于傅里叶变化给出平移不变，旋转不变和原点中心化的特性。

答：傅里叶变化的5个性质：

（1）可分离性。一个二维变换分解为两个一维变换的计算。

（2）周期性。二维函数和它的逆DFT都具有周期性，周期为N，即：

（3）卷积定律。两个函数卷积的DFT与这两个函数的DFT乘积相等，即：

（4）旋转性。如果空间域函数f(x,y)旋转θ0角度后，相应的傅立叶变换F(u,v)在频域中也旋转同一θ0角，反之亦然。

（5）分配律。两个函数和的和与这两个函数的DFT的和相等。

（6）尺度性。函数的DFT乘以k与k乘以函数的DFT是相同，即：

以上DFT性质也适用于CFT。

21 给出hough变换三角形式的推导，说明其应用机理。（给出hough 变换三角形式的推导，说明广义hough变换应用）

对于任意两点的直线方程：y=ax+b

由于垂直直线a为无穷大，我们改用极坐标形式： xcosθ+ysinθ=ρ参数平面为θ，ρ，对应不是直线而是正弦曲线使用交点累加器，或交点统计直方图，找出相交线段最多的参数空间的点然后找出该点对应的xy平面的直线线段。

Hough变换的基本思想：

对于边界上的n个点的点集，找出共线的点集和直线方程。

对于任意两点的直线方程：y=ax+b，构造一个参数a，b的平面，从而有如下结论

1） xy平面上的任意一条直线y=ax+b，对应在参数ab平面上都有一个点

2）过xy平面一个点（x，y）的所有直线，构成参数ab平面上的一条直线

3）如果点（x1，y1）与点（x2，y2）共线，那么这两点在参数ab平面上的直线将有一个交点

4）如果参数ab平面上相交直线最多的点，对应的xy平面上的直线就是我们的解。

22真彩、假彩、伪彩的应用（07、08、09）（10：举例说明真彩、假彩、伪彩的定义和区别？）

真彩：当光谱采样限制在人类视觉敏感的红蓝绿光谱段时，称为真彩图像。真彩图片可以进行亮度增强，色度增强，以及饱和度增强。

伪彩色处理：把黑白图象处理成伪彩色图象。应用于黑白照片变成彩色照片。

假彩色处理：把真实的自然彩色图象或遥感多光谱图象处理成彩色图象。用途：（1）景物映射成奇异彩色，比本色更引人注目。（2）适应人眼对颜色的灵敏度，提高鉴别能力。如人眼对绿色亮度响应最灵敏，可把细小物体映射成绿色。人眼对蓝光的强弱对比灵敏度最大。可把细节丰富的物体映射成深浅与亮度不一的蓝色。（3）遥感多光谱图象处理成假彩色，以获得更多信息。

3 简单表述正交变换的性质，说明在图象处理中常用的有些？

答：正交变换是酉变换的特例。利用某些正交变换，可以从图像中提取某些特征，其次，可以在正交变换的基础上完成图像的编码。具有以下性质：

（1）正交变换具有熵保持性质。

（2）正交变换有能量保持性质。

（3）能量重新分配与集中。

（4）去相关性。即可以使高度相关的空间样值变为相关性很弱的变换系数。

这些性质是信号与图像压缩编码的理论基础。

在图象处理中常用的有：傅立叶变换、离散余弦变换，离散沃尔什--哈达码变换，离散K-L变换。

23 Radon/hough 变换的主要思想是什么，有何应用

Radon是计算图像在某一指定角度射线方向上投影的变换方法,二维函数f(x,y)的投影就是指定方向上的线积分。Randon逆变换可以根据投影数据重建图像，这在X射线断层摄影分析中常常使用。

Hough变换是一种线描述方法，可以将笛卡儿坐标空间的线变换为极坐标空间的点，使不同坐标系中线和点建立一种对应关系。基于Hough变换，可利用图象全局特性将目标边缘像素连接起来组成目标区域的封闭边界或直接对图象中已知形状的目标进行检测，并有可能确定边界亚像素精度。Hough变换适合检测图象中某些给定形状的曲线并用参数方程描绘出来。其优点是检出曲线的能力较少受到曲线中断点等干扰的影响，因而是一种快速形状检出方法。

7 给出radon变换三角形式的推导，说明变换应用

表示（x，y）的radon变换，其定义为f（x，y）在与y轴夹角为，与原点距离为s的直线上的线积分

推导到这里有什么用？？？

Radon是计算图像在某一指定角度射线方向上投影的变换方法,二维函数f(x,y)的投影就是指定方向上的线积分。Randon逆变换可以根据投影数据重建图像，这在X射线断层摄影分析中常常使用

4 给出直方图均衡化的推导及伪代码

直方图均衡化技术基于在直方图均衡化中使用完全图像的直方图变换，目标是获得输出图像的均匀直方图。让变量r表示图像灰度级的一个随机变量。开始，假设r是连续的，且在闭合区间[0:1]内，r=0表示黑色，且r=1表示白色。对于在指定区间的任意r，假设形式的变换：

s=T(r)

变换为在原始图像中的每个像素r产生了级s。假设变换T满足以下条件：

● T(r)是一个单值函数，在区间[0:1]单调地增加。

● T(r)位于0-1之间。

第一个条件保留了从黑到白的灰度级次序，而第二个条件保证了函数与像素灰度值的允许范围保持一致。从s到r的逆变换可以表示为：

让原灰度级和变换灰度级分别表示成它们的概率密度函数和。然后从基本的概率论可知，如果和已知，且如果满足条件，那么变换灰度级概率密度函数如下：

①

如果变换为：

②

在①式中令=，得出=1。因此通过公式②给出的变换可以获得图像的均匀分布直方图。

伪代码：

1）对图像中的每个像素获得的灰度值是变量i，对于L级图像当i=0到L-1时。

hist[i]=hist[i]+1…

2）从直方图阵列，得到直方图的累积频率

3）产生了均衡直方图为：

这里，L表示在图像中灰度级的数量，表示在N*N图像中像素的数量。是x截断的最近整数

5）对于每个i，有eqhist[i]替换灰度值i，eqhist包含了新映射的灰度值。

2 给出灰度共生矩阵的表示，说明其意义。并求出下列图象的共生矩阵的M(1,0)

灰度共生矩阵是以条件概率提取纹理的特征，它反映的是灰度图像中关于方向，间隔和变化幅度等方面的灰度信息，因此可以用于分析图像的局部特征以及纹理的分布规律。

灰度共生矩阵有两种定义形式。

1）设灰度图像矩阵为G，位置相距为(Dx,Dy），灰度值为i和j的两个像素点对同时出现的联合概率分布称为灰度共生矩阵。

2) 设某个点对的间隔为d，两点之间连线与x轴的方向角为，两点灰度级为i和j，则其共生矩阵可以表示为，点（i,j）处的值代表的是满足对应条件的数目值。

M(Dx,Dy）为4*4矩阵，若灰度再分档，如1，2属于低档L，3，4属于高档H，M为2*2矩阵。这时求(Dx,Dy)=（1，0）的M(1,0)= 。

2、当在白天进入一个黑暗剧场时，在能看清并找到空座位时需要适应一段时间，试述发生这种现象的视觉原理。

答：人的视觉绝对不能同时在整个亮度适应范围工作，它是利用改变其亮度适应级来完成亮度适应的。即所谓的亮度适应范围。同整个亮度适应范围相比，能同时鉴别的光强度级的总范围很小。因此，白天进入黑暗剧场时，人的视觉系统需要改变亮度适应级，因此，需要适应一段时间，亮度适应级才能被改变。

1、设一幅图像有如图所示直方图，对该图像进行直方图均衡化，写出均衡化过程，并画出均衡化后的直方图。若在原图像一行上连续8个像素的灰度值分别为：0、1、2、3、4、5、6、7，则均衡后，他们的灰度值为多少？

（15分）

答：①，k=0，1，…7，用累积分布函数（CDF）作为变换函数T[r]处理时，均衡化的结果使动态范围增大。

②均衡化后的直方图：

③0、1、2、3、4、5、6、7均衡化后的灰度值依次为1、2、2、3、3、4、4、7

3、简述梯度法与Laplacian算子检测边缘的异同点？

答：梯度算子和Laplacian检测边缘对应的模板分别为

（梯度算子）（Laplacian算子）（2分）

梯度算子是利用阶跃边缘灰度变化的一阶导数特性，认为极大值点对应于边缘点；而Laplacian算子检测边缘是利用阶跃边缘灰度变化的二阶导数特性，认为边缘点是零交叉点。（2分）

相同点都能用于检测边缘，且都对噪声敏感。（1分）

1．什么是正交变换？用于图像处理的正交变换有哪些？各有何作用？。

在图像处理中，图像变换主要目的是将图像的能量尽量集中在少量系数上，从而最大限度地去除原始图像数据中的相关性！正交变换有去除相关性和能量集中的性质。

变换编码不是直接对空域图像信号编码，而是首先将空域图像信号映射变换到另一个正交矢量空间(变换域或频域)，产生一批变换系数，然后对这些变换系数，进行编码处理。

数字图像信号经过正交变换为什么能够压缩数据量呢？先让我们看一个最简单的时域三角函数的例子，当t从－∞到＋∞改变时，是一个正弦波。假如将其变换到频域表示，只需幅值A和频率f两个参数就足够了，可见在时域描述，数据之间的相关性大，数据冗余度大；而转换到频域描述，数据相关性大大减少，数据冗余量减少，参数独立，数据量减少。

变换编码技术已有近30年的历史，技术上比较成熟，理论也比较完备，广泛应用于各种图像数据压缩，诸如单色图像、彩色图像、静止图像、运动图像，以及多媒体计算机技术中的电视帧内图像压缩和帧间图像压缩等。

正交变换的种类很多，如傅立叶（Fouries）变换、沃尔什（Walsh）变换、哈尔（Haar）变换、斜（slant）变换、余弦变换、正弦变换、K-L（Karhunen - Loeve）变换等。

2．举例说明直方图均衡化的基本步骤。

直方图均衡化是通过灰度变换将一幅图象转换为另一幅具有均衡直方图，即在每个灰度级上都具有相同的象素点数的过程。
      直方图均衡化变换：设灰度变换s=f(r)为斜率有限的非减连续可微函数，它将输入图象Ii(x，y)转换为输出图象Io(x，y)，输入图象的直方图为Hi(r)，输出图象的直方图为Ho(s)，则根据直方图的含义，经过灰度变换后对应的小面积元相等：Ho(s)ds=Hi(r)dr
直方图修正的例子
假设有一幅图像，共有6 4(6 4个象素，8个灰度级，进行直方图均衡化处理。
根据公式可得：
s2=0.19+0.25+0.2l=0.65，s3=0.19+0.25+0.2l+0.16=0.8l，s4=0.89,s5=0.95，s6=0.98，s7=1．00
      由于这里只取8个等间距的灰度级，变换后的s值也只能选择最靠近的一个灰度级的值。因此，根据上述计算值可近似地选取：
      S0≈1／7，s 1≈3／7，s2≈5／7，s3≈6／7，    s4≈6／7，s5≈1，s6≈l，s7≈1。
      可见，新图像将只有5个不同的灰度等级，于是我们可以重新定义其符号：
      S0’=l／7，s1’=3／7，s2’=5／7，s3’=6／7，s4’=l。
因为由rO=0经变换映射到sO=1／7，所以有n0=790个象素取sO这个灰度值；由rl=3／7映射到sl=3／7，所以有1 02 3个象素取s 1这一灰度值；依次类推，有850个象素取s2=5／7这一灰度值；由于r3和r4均映射到s3=6／7这一灰度值，所以有656+329=98 5个象素都取这一灰度值；同理，有245+1 22+81=448个象素都取s4=1这一灰度值。上述值除以n=4096，便可以得到新的直方图。

3．图像编码压缩方法有哪几类？列举出几个有损和无损的压缩方法。画出编解码的系统结构图。

图像压缩可以是有损数据压缩也可以是无损数据压缩。对于如绘制的技术图、图表或者漫画优先使用无损压缩，这是因为有损压缩方法，尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像，例如一些应用中图像的微小损失是可以接受的（有时是无法感知的），这样就可以大幅度地减小位速。

　　无损图像压缩方法有：

　　行程长度编码

　　熵编码法

　　如 LZW 这样的自适应字典算法

　　有损压缩方法有：

　　将色彩空间化减到图像中常用的颜色。所选择的颜色定义在压缩图像头的调色板中，图像中的每个像素都用调色板中颜色索引表示。这种方法可以与抖动(en:dithering)一起使用以模糊颜色边界。

　　色度抽样，这利用了人眼对于亮度变化的敏感性远大于颜色变化，这样就可以将图像中的颜色信息减少一半甚至更多。

　　变换编码，这是最常用的方法。首先使用如离散余弦变换（DCT）或者小波变换这样的傅立叶相关变换，然后进行量化和用熵编码法压缩。

　　分形压缩（en:Fractal compression）。

2. 简述JPEG的压缩过程，并说明压缩的有关步骤中分别减少了哪种冗余？
答：分块－＞颜色空间转换－＞零偏置转换－＞DCT变换－＞量化－＞符号编码。颜色空间转换，减少了心理视觉冗余；零偏置转换，减少了编码冗余；量化减少了心理视觉冗余；符号编码由于是霍夫曼编码加行程编码，因此即减少了编码冗余（霍夫曼编码）又减少了像素冗余（行程编码）。
ＪＰＥＧ2000的过程：图像分片、直流电平（DC）位移，分量变换，离散小波变换、量化，熵编码。

相关推荐