为什么计算机会看
人类眼中的大自然是一个绚丽多彩的世界。人类能用眼睛感知周围景物的图像,还能够根据以往的经验识别和理解这些图像的含义。现在计算机在一定程度上也能感知和理解景物图像,即计算机在一定程度上也能看东西。
曾经有过一则报道,20世纪70年代初的某日,一个“大胡子”在中东某机场登上了飞往巴黎的客机。当飞机抵达巴黎后,在海关的出口处,“大胡子”被法国警察逮捕了。是计算机识别出了这是名恐怖分子。尽管他乔装打扮,还是未能瞒过计算机的“火眼金睛”。原来,法国警察早就收集了那些恐怖分子的照片,把图像输入到计算机中。在机场的出口处,电眼——电子摄像机注视着经过的旅客,并对旅客的图像进行分析、比较等一系列处理。当正在处理的图像与已存入的恐怖分子的照片图像一致时,计算机系统就立即向警察报警。
计算机的“眼睛”实际上是一些类似摄像机的成像设备。对由这种成像设备所得到的图像,先经过一些专用装置与计算机配合起来进行预处理,以改善其视觉质量。然后可把它转换成计算机内部的表示形式,即把图像进行数字化。在计算机内部,所有信息都是由数字化的代码来表示的。数字图像的数据量是很大的,比如将一帧黑白电视图像数字化为一幅512×512×8比特的图像,其数据量超过256KB。如果是彩色图像,则至少还要增加3倍。因此,必须对图像进行压缩存储,否则,当处理连续的影像时,存储空间很快会被占满,以致计算机再也无法处理。
接下来计算机就对图像的内部表示用一系列复杂的数学变换进行处理。
最后从上述信息中获得场景中物体的三维描述,识别出其中存在的物体,确定这些物体的位置和姿态,再将这种表示与系统模型库中已有的物体模型相匹配(即进行识别),识别后就可进一步进行定位工作。这与人类的视觉过程是类似的。人在看到一幅图像之后,要分离出其中的物体,并在大脑中对该物体进行检索和回忆,识别出该物体,进而取得有关该物体的信息。到了这一步,计算机便完成了对景物图像的感知和理解。
计算机视觉与人类视觉相比,还处于比较低级的阶段。人类视觉信息的不断研究与探明,必将对计算机视觉技术的发展起到促进作用。
关键词:视觉 图像处理 图像识别