1.图像 图像对我们并不陌生。它是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视知觉的实体。人的视觉系统就是一个观测系统,通过它得到的图像就是客观景物在人心目中形成的影像。我们生活在一个信息时代,科学研究和统计表明,人类从外界获得的信息约有75%来自视觉系统,也就是从图像中获得的。这里图像是比较广义的,例如照片、绘图、视像等等。图像带有大量的信息,百闻不如一见,一图胜千字都说明了这个事实。 2.数字图像 常见图像是连续的,即图像灰度的值可以是任意实数。为了能用计算机对图像进行加工,需要把连续的图像进行空间域的采样和幅度值域的量化,即所谓的离散化。这种离散化了的图像是数字图像。 3.RGB颜色空间 对一种颜色进行编码的方法统称为“颜色空间”或“色域”。用最简单的话说,世界上任何一种颜色的“颜色空间”都可定义成一个固定的数字或变量。RGB(红、绿、蓝)只是众多颜色空间的一种。采用这种编码方法,每种颜色都可用三个变量来表示—-红色、绿色以及蓝色的强度。记录及显示彩色图像时,RGB是最常见的一种方案。 4.YUV色彩系统甲 YUV(亦称YcrCb)是被欧洲电视系统所采用的一种颜色编码方法(属于PAL)。YUV主要用于优化彩色视频信号的传输。与RGB视频信号传输相比,它最大的优点在于只需占用极少的带宽(RGB要求三个独立的视频信号同时传输)。其中“Y”表示明亮度(1uminance或 Luma),也就是灰阶值;而“U”和“V”表示的则是色度(Chrominance Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。 5.图像识别、图像处理与图像理解的关系 在研究图像识别时,往往对什么是图像识别,什么是图像处理搞不清楚。其实,这两者的关系非常密切;互相交错,很难截然分开。现就图像处理、识别及图像理解的过程、作用与目的看一看它们之间的关系。 (1)图像处理 在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等。这样可提高信噪比,有时由于信息微弱,无法辩识,还得进行增强。增强的作用,在于提供一个满足一定要求的图像,或对图像进行变换,以便人、机分析。并且为了从图像中找到需要识别的东西,还得对图像进行分割,也就是进行定位和分离,以分出不同的东西。为了给观察者以清晰的图像,还要对图像进行改善,即进行复原处理,它是把已经退化了的图像加以重建或恢复的过程,以便改进图像的保真度。在实际处理中,由于图像信息量非常大,在存储及传送时,还要对图像信息进行压缩。 上述工作必须用计算机进行,因而要进行编码等工作。编码的作用,是用最少数量的编码位(亦称比特),表示单色和彩色图像,以便更有效地传输和存储。 以上所述都属于图像处理的范畴。因此,图像处理包括图像编码、图像增强、图像压缩、图像复原、图像分割等。对图像处理环节来说,输入是图像,输出也是图像,也就是处理后的图像,如图6—1a所示。由图像处理的内容可见,处理的目的,主要在于解决二个问题:一是判断图像中有无需要的信息;另一是确定这些信息是什么。例如,就机械零部件识别的数据信息来说,计有: ●零部件的亮度和色度信息; ●零部件的形状信息; ●纹理信息; ●尺寸信息; ●几何精度信息等。 抽取这些有用信息的主要目的在于改善图像质量和进行图像识别。 (2)图像识别 图像识别是对上述处理后的图像进行分类,确定类别名称,它可在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征;最后根据测量结果作分类。为了更好地识别图像,还要对整个图像作结构上的分析,对图像进行描述,以便对图像的主要信息得到一个解释和理解,并通过许多对象相互间的结构关系对图像加深理解,以便更好地帮助识别。所以图像识别是在上述分割后的每个部分中,找出它的形状及纹理等特征,即特征抽取(有时也包括图像分割),以便对图像进行分类,并对整个图像作结构上的分析。因而对图像识别环节来说,输入是图像(一般是经过上述处理过的图像),输出是类别和图像的结构分析见图6—1b,而结构分析的结果则是对图像作描述,以便对图像的重要信息得到一种理解和解释。 这里要注意的是,图像分割不一定完全在图像处理时进行,对有些问题,一面进行分割,一面进行识别,如机械零件的分拣、分档就是如此。所以说,图像处理和图像识别是相互交叉的。
图6-1图像处理、识别及理解示意图 a:图像处理示意图b:图像识别示意图c:图像理解示意图 (3)图像理解 所谓图像理解是一个总称。上述图像处理及图像识别的最终目的,就在于对图像作描述和解释,“以便最终理解它是什么图像。所以它是在图像处理及图像识别的基础上,再根据分类作结构句法分析,去描述图像和解释图像。因而图像理解包括图像处理、图像识别和结构分析。对理解部分来说,输入是图像,输出则是图像的描述与解释,如图6-1c所示。 实质上,图像理解属于人工智能的范畴。图像理解也要作图像处理、识别及结构分析。例如计算机下棋,就需要作这些工作。首先要把人的智慧存储在计算机中,教给它多少智慧,它就存有多少智慧。这是机器固有的,但是计算机在接受了一部分“智慧”后,便能根据逻辑推理进行分析、推断等工作。 (4)图像识别、图像处理与图像理解的关系 如上所述,图像理解是一个总称,它是一个系统。其中每一部分和其前面的一部分都有一定的关系,也可以说有一种反馈作用,例如分割可以在预处理中进行,并且,该系统不是孤立的,为了发挥其功能,它时时刻刻需要来自外界的必要信息,以便使每个部分能有效地工作。这些外界信息是指处理问题及解决问题的看法、设想、方法等等,例如,根据实际图像,在处理部分需要采用什么样的预处理,在识别部分需要怎样分割,抽什么样的特征及怎样抽取特征,怎样进行分类,要分多少类,以及最后提供结构分析所需的结构信息等等。 在该系统中,“预处理”、“分割”一般可以算作图像处理;“特征抽取”、“分类”属于图像识别;而句法图像识别所涉及的内容则是从识别到结构分析,整个系统所得到的结果是图像的描述及解释。当某个新的对象(图像)送进系统时,就可以进行解释,说明它是什么。
|