引论:我们为您整理了13篇数字图像处理综述范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。
篇1
数字图像处理技术发展是十分迅速的,从早期的电报打印机打印的粗糙图片,到图像信号可以远距离传输并清晰显示出来,到现在数字图像处理技术可以观看到人体内部组织结构等等,在技术发展的同时,在人们生活中的作用也越来越显著。
1 数字图像处理技术的主要分类
数字图像处理的技术基本可以分为两大类:分别是模拟图像处理和数字图像处理.模拟图像处理内容主要包括光学图像处理和电子图像处理。如人们平常拍照、摄像头监控和电视信号处理等都属于模拟图像处理。模拟图像处理的优点是处理速度快,系统占用运行内存小,图像实时性强, 能够在处理的同时进行其他图像的处理,其缺点是处理精度较差,处理功能比较单一,没什么智能判断能力和非线性处理的能力。
数字图像处理技术是目前主流的处理技术,其功能的实现一般需要计算机软件的支持,所以一般也称之为计算机图像处理。数字图像处理有很多优势,如处理内容方面,处理精度方面,处理灵活性等等都是模拟图像处理所比不上的,而且可以进行复杂的非线性处理,改变处理功能只需要进行不同功能模块的重新编码和参数变换,但其处理速度慢,尤其是在进行复杂的图像处理时更要占用更高的内存。
2 数字图像处理技术的主要内容
2.1 图像的显示
图像显示是数字图像处理技术中最基本也是最重要的一门技术,对于计算机来说,获取信息的最直观的方式就是图像的观看,任何其他图像处理技术都需要先显示图像,然后在图像做后续操作,如对图像进行特效显示,包括图像的扫描,图像的移动,分条栅栏,马赛克效果,百叶窗效果等,所以图像显示的原理和基本方法是数字图像处理技术中所必须掌握的[1]。
计算机显示图像并不是直接打开图像并显示在电脑荧幕上,当大家想要打开一幅图像时,计算机首先得调用电脑自带的调色板,一幅位图里面包含了图像颜色信息表,当载入位图,并且准备打开位图的时候,系统会先将位图自身的颜色信息表即调色板载入系统调色板,然后显示硬件调用系统调色板就可以显示位图原来的颜色了。
2.2 图像的几何处理
为了满足视觉的不同需要,人们需要对图像的显示进行不同的处理,以求给人带来最适合的视觉效果,其方法包括坐标变换,图像的放大,缩小,旋转、移动等。
2.3 图像的变换域处理
数字图像处理经常要用到线性系统,在图像处理中使用空间作为参数来描述,通常用二维系统进行表示,输入函数f(x,y)表示原始图像,输出函数g(x,y)表示经处理后的图像,线性系统可以看作是输入函数和输出函数之间的一种映射w,反映了各种线性图像的处理方法,关系公式如下:
当将图像有空间域变换到频域时,一般要用到线性正交变换,线性正交变换算法主要包括傅立叶变换离散小波变换,离散余弦变换等。
2.4 图像的锐化处理
许多图像里面的有用信息比较不显眼,这时需要对图像进行增强显示,抑制其中不重要的信息,突出显示其中重要的信息,让两个部分有鲜明的对比,能让用户有更加直观的视觉信息,可以提高有用信息的接收率。
而图像复原的目的也是为了增强图像的显示效果,它跟图像增强的区别在于:图像增强是采用各种技术来增强图像的视觉效果,不去考虑之前的图像是因为什么原因需要增强。因此,图像增强是以图像符合人们的视觉观为主,不用管增强之后和原图是不是有比较大的区别。图像复原处理跟图像增强处理完全不同,它需要知道图像复原前的算法,并且根据已经退化的图像得到逆算法将图像复原,然后才能对图像进行增强处理。
2.5 JPEG图像的压缩编码
其核心思想就是在满足一定质量的情况下减少图像占用的内存,因为图像中有许多与大家想要信息无关的区域或冗余信息,这些信息不仅占用内存,而且传输过程中需要更多的带宽,所以,对图像进行编码压缩能尽可能节约带宽资源,提高传输速度,给图像显示带来更好的体验。图像压缩编码方法很多,从信息论方面看主要可以分为两大类:冗余度压缩方法和信息度压缩方法。
2.6 图像的灰度变换
图像的灰度变换处理是图像增强处理技术中单个一种非常基础、直接的空间域处理方法,灰度处理是指根据某种目标条件按一定变换关系逐点改变原图中每个像素灰度值的方法,目的是为了改变图像质量,让图像显示效果更加清晰,如摄像头在室内光照不强时会导致图像显示不清晰,灰度过于集中。灰度变换处理方法主要包括线性变换和非线性变换。
图像处理内容包括很多方面,以上所举只是一部分,专业的数字图像处理技术是远远不止这些方面的,随着计算机技术发展越来越快,数字图像处理技术的复杂程度只会越来越深,所以,在数字图像处理技术这一门博大精深的课程中,择一而精也是一个很好学习态度[2]。
3 数字图像处理的应用
数字图像处理技术在各行各业应用都不可或缺,它已经从刚开始的高科技领域逐步渗透到人们的日常生活中,例如天气预报信息收集、医院身体各方面检测、银行自助提款机、全国各地的大小超市商品编码、道路交通监控、重要部门的监控报警系统、可视电话视频传输技术、互联网媒体信息传输等等。
3.1 遥感航天中的应用
天文、太空星体的探测及分析,数字图像处理可以根据拍摄到的星体轮廓等进行智能分析。军事侦察、定位、指挥等,如现在的卫星地图,手机定位系统;地质、地形、地图的普查及绘制,如网上和手机上和司机普遍使用的电子地图和导航仪;地下矿藏的侦察,地质勘查仪等通过超声波检测地质层,然后用数字图像处理的方法把地质层构成显示出来;环境污染的监控,有物理监控和自动化智能监控等;气象、天气预报的合成分析。
3.2 生物医学中的应用
显示图像处理,平常我们所使用的CT照,B超等技术;DNA显示分析;生物进化的图像分析;专家系统如手术规划;内脏大小、形状、活动及异常检出分析;癌细胞的识别。
3.3 工业应用
产品无损检测、焊缝及内部缺陷检测;流水线零件自动检测识别;生产过程的监控;交通管理、机场监控;支票、签名辨伪及识别;机器人视觉系统的应用。
3.4 军事公安领域中的应用
罪犯脸型的合成;指纹自动识别;巡航导弹主动识别;手迹、印章的鉴定识别;遥控飞行器的引导;雷达的目标侦察。
数字图像处理短短几十年得到了飞跃式的发展,技术的精进带来的是我们生活中、科技中。教育中、医学中的各种技术的发展,人们的生活质量在一天天提高,工厂和生产等的工作效率也是突飞猛进,这些都离不开智能化,自动化的数字图像处理技术,在未来的不久,数字技术将给我们带来更为巨大的改变。
篇2
1 引言
胶带的纵向撕裂问题是一个在国内国际都普遍存在的问题[1]。如何设计一种能对胶带实行实时监控的、并且在纵向撕裂发生后快速可靠的胶带保护装置,在国内外都是一个正在努力攻克的难题。相比较而言,由于我国煤矿的数量和胶带输送机的数量远远超过国外任何一个国家,而国内的胶带质质量与国外相比有很大的差距,纵向撕裂识别和保护问题在我国煤矿生产中更加受到重视,其中亟待解决的问题之一是进行有效的实时识别纵向裂缝。
国内外从70年代就开始纵向裂缝的识别研究,己从接触式发展到非接触式,从单一化到智能化,除嵌入法、光电传感技术、超声波扫描技术之外,现在又有了改进后的嵌入法、超声波技术和最新研究探讨的原子物理方法等等。由于煤矿生产环境的恶劣,每种方法都有其不成熟和不稳定的地方。因此,本文利用数字图像处理技术灵活性高、再现性好、处理精度高、适用面宽以及处理算法和图像特点相关性高的优点,根据矿用胶带图像的特点,选取结构识别方法,利用裂缝处灰度跳变的特性,使用了符合其特点连通域检测,通过图像预处理,图像切割,以及连通域检测三个步骤实现了矿用胶带的纵向裂缝的识别。
2 图像的分析及其预处理
当大多数纵向撕裂发生后,胶带表面会有变化,用肉眼能辨别的出来,我们可以在胶带下安装若干个摄象头,然后用计算机进行图象识别,利用胶带撕裂前后的图象特征变化来进行即时的监控。即可以进行预防以及及早的对发生的撕裂进行处理。由于胶带下面的环境比较恶劣,我们可以使用低照长寿命ccd摄象机。摄象机的安装地点要兼顾实用性和经济性,基于以上两个原则,要安装在最容易发生胶带撕裂的部位,在胶带的机头、机尾以及转折点各安装一个,以一个适合的高度尽可能照顾大的范围。
本实验系统由CCD摄像头、数据采集卡及识别软件系统和电脑组成。其中硬件包括CCD采集卡、视频采集卡和电脑主机;识别系统模块包括图像采集模块,预处理模块,边缘检测模块以及识别模块。
首先对裂缝图像进行了整体、灰度、噪声三个方面进行了分析,得到其几何、数学、灰度分布上的特点,针对这些特点选择合适的图像处理算法。由于彩色图像其信息容量比灰度图像大,因此处理难度大、速度慢,而且在识别裂缝的过程中,灰度图像所含的信息量已经足够,因此先将彩色图像转换成为灰度图像。然后根据图像的灰度直方图进行像素分析,根据分析的结果进行自适应阈值分割,通过计算或设定一个概率值,根据总像素值和灰度分布来确定分割的阈值,然后调用阈值分割程序来进行阈值分割。图像预处理还包括最重要的一个部分:图像滤波,分析了图像噪声来源,选择了合适的滤波器,对滤波效果进行了分析,并对不同形状的裂缝选择了不同的滤波模板。
其次对图像进行形态学处理。由于在一幅裂缝图像中,在图像预处理的过程中或多或少的会对原始图像中的裂缝区域带来影响,例如:将属于裂缝区域的点去除,可能导致连续的一条裂缝被分割为几条或裂缝的区域减小,因此要对预处理后的图像进行形态学处理,使裂缝区域得到恢复和加强。图1(b)是使用中值滤波进行平滑处理的效果。
3 图像边缘分割
图像分割是实现图像识别胶带是否撕裂的重要步骤,分割效果的好坏直接影响这系统的识别率,是特征提取、裂缝识别的前提准备步骤,在系统视线中占有不可忽视的地位,因此如何提高分割效果,减轻识别难度也就成了我们的首要任务,也是课题实现的难点之一。主要体现在以下两个方面:首先,目前不存在适合所有类型图像的通用分割算法,现有的分割算法都是针对具体应用而设计的,因此我们必须根据胶带撕裂裂缝图像的特征,即直方图没有明显双峰,裂缝与背景的比例像素悬殊等特点,来设计适合本系统的分割算法,其次,由于本文中尽心分割的裂缝图像是从实际环境中获取的,受到的干扰很大,煤矿胶带下的情况恶劣,造成我们获得的原始图像质量较差,为进行有效分割带来困难,因此选择一个分割算法,使其能够最大程度去除噪声、边界、伪缺陷等非裂缝区域,保留裂缝区域,减轻后续处理的复杂度,是本步骤的关键。
常用的算子可以分为一阶微分算子和二阶微分算子。一阶微分算子通过梯度值来进行边缘检测,用此方法可以忽略细节,得到的边缘也较粗,如图2所示为一阶算子Sobel算子对胶带裂缝轮廓的提取图;二阶微分算子是通过寻找二阶微分中的零穿越来检测边缘。用此方法得到的边缘较细,在细节方面较好,但物体的整体轮廓不如一阶微分算子明显。由于纵向裂缝识别是以裂缝轮廓作为基础,而对其它细节可以不予考虑,从上面提取的裂缝轮廓图像可以看出Sobel算子符合识别的要求,所以选择Sobel算子。
4 纵向裂缝的提取和识别
对于二值图像的连通域标记处理操作就是从白色像素(通常用“1”来表示)和黑色像素(通常用“0”表示)组成的一幅点阵图像中,将互相邻接(一般研究的是4邻域连接)的目标“1”值像素集合提取出来,并为图像中不同的连通域填入不等的数学标记。该处理过程是图像处理和分析中一个非常重要的基础操作,有着广泛的应用领域。
为了对图像的连通域进行标记,需要对一幅图像作从左到右,从上到下的水平扫描。需检测当前被扫描到的点是不是和周围的点连通,需要检查当前的像素和以前标记过的邻近像素的值是否一样。如果当前像素的值和邻近像素的值一样,就表示它们连通,反之,就表示和此邻近像素不连通,此时当前点就要给一个新的标记,同时标记保留在一个与原二值图像像素点个数相同的二维数组中。
令S代表一幅图像中的像素子集,如果在S中全部像素之间存在一个通路,则可以说两个像素p和q在S中是连通的。对于S中的任何像素p,S中连接到该像素的像素集叫做S的连通分量。如果S仅有一个连通分量,则集合S叫做连通集。在很多场合,二值图像提取连通分量是许多自动图像分析应用的核心任务。
现场图像经过二值化处理后,形成多个互不相连的区域,而单个区域都是连通的,将连通域分开标记,就可以得到多个独立的区域,连通域标记算法可以找到图像中所有的连通成分,并对同一连通成分的所有点分配同一标记。
具体算法如下:
(1)将所有的白色像素(背景)赋值为0,所有黑色像素(裂缝连通域所在)赋值为-1,连通域个数置为0;
(2)寻找一个连通域开始的像素(值为-1),并将其值改为当前连通域数,存储,连通域个数增加1;
(3)所有像素搜索。找到值为-1的像素(表示没有被搜索过),正向搜索其周围有没有值为当前连通域数的像素。如果有,将当前像素赋以连通域的值;
(4)如果没有像素被搜索,表示当前所有像素已被遍历,转步骤2;
(5)如果步骤2中没有找到开始像素,表示所有连通域已经被遍历。
5 结语
本文利用图像处理技术,针对胶带撕裂图像中的裂缝进行识别,分析了该图像的特点,通过图像预处理,图像切割,以及连通域检测三个步骤识别裂缝。取得了以下的成果。
(1)裂缝图像预处理。分析裂缝图像的像素分布,得到其分布上有相似灰度级出现概率不同的特点。并且分析了裂缝图像中的噪声来源。针对其特点选用中值滤波。这个模块主要完成了彩色图像的灰度化、灰度拉伸、中值滤波处理。
(2)裂缝的边缘检测。比较了几种边缘检测的方法,得到了效果最好的Sobel边缘检测方法,方便下一步的裂纹检出。
(3)裂缝检出。经过前期处理后,图像中的裂缝从背景中分离出来,每个裂纹形成一个像素互相连通的区域,利用连通域检测算法,从而将裂纹检测出来。
[参考文献]
[1] 黄民,李恩等.钢绳芯输送带纵向撕裂监测方法研究[J].中国矿业大学学报,2002.31.
[2] 刘英林.输送带纵向撕裂的检测与监视[J].山西矿业学报,1995(13).
[3] 吴剑锋,张红卫.胶带输送机胶带损坏原因及运行理论分析[J].中州煤炭,2005,2.
篇3
1.数字图像处理技术的内容及特点
1.1 研究内容
不管应用到哪个领域的图像处理图像数据都要输入、加工和输出图像,其研究内容:
(1)获取、表示和表现图像――把图像信号转化为计算机可以识别的形式,并把数字图像显示和表现出来。
(2)图像复原――已知图像发生退化的缘由时,对图像进行修复,关键是建立退化模型。复原是以模型和数据的图像恢复为基础,消除退化的影响。
(3)图像增强――对图像质量的常规改善。当不知道图像退化原因时,还可用此技术比较主观的改善图像。
(4)图像分割――人类视觉系统可以轻松地将观察到的对象区分开来,但计算机却很难。分割的基本问题目前是将各种方法融合使用,以此提高处理的质量。
(5)图像分析――检测和测量图像中的目标,获取其客观信息,是从图像到数据的过程。
(6)图像重建――指从数据到图像的处理。
(7)图像压缩编码――为减少数据容量、降低数据率、压缩信息量,在不影响其效果的前提下减少图像的数据量。
1.2 数字图像处理技术的特点
(1)图像再现性好――不会因为对图像的变换操作而影响到图像质量;
(2)图像处理精度高――可以将图像数字处理为任意大小的数组;
(3)适用面宽――来自不同信息源的图像被变换为数字编码形式后,都可以用数组来体现灰度图像。
(4)灵活性高――图像处理可完成线性及非线性处理。
2.应用领域
数字图像处理技术被应用到越来越多的领域中,如医疗保健、航空航天、交通通信、军事、工业、农业、林业等。下面选取几方面进行分析:
(1)试听资料证据――视听资料证据是重要的诉讼证据,在司法诉讼活动中发挥着越来越重要的作用,数字图像处理技术是视听资料证据中图像证据资料技术性司法鉴定的常用手段,是图片原始性、真伪性、相关性认定的基本方法,如名捕监控录像模糊图像处理系统,该系统是手印、足迹、枪弹痕迹、工具痕迹、印章检验、文件检验以及录像带处理等痕检、文检、视频图像处理工作的必备工具;以及实时视频降噪仪,能够实时处理现场录像流,增强视频的清晰度,该在录像安全系统中加强监视录像的清晰度,或者在警方实地调查拍摄录像后回到警署再进行降噪。
(2)电子商务――当前的电子商务中,图像处理技术也大有可为,如身份认证、产品防伪和水印技术等。
(3)军事公安领域――军事的目标是侦察、制导和警戒系统和自动灭火器的控制及反伪装;公安部门的现场照片、指纹、手迹、印章和人像等的处理和辨识;历史文字和图片档案的修复和管理等。而数字图像处理技术将数码摄影和图像处理技术结合起来以其独特的优势在公安领域中逐步开始担当重任,在刑事摄影、档案管理、痕迹检验、文件检验、法医、物证提取以及公安教学或宣传中发挥着巨大作用,为广大的公安人员开阔了视野、拓展了思维空间,为执法的公正性提供了有力保证,应用提高了工作效率,减少了人、财、物的消耗,大大提高了工作效率。
(4)智能交通――图像处理具有算法柔性大、适应能力强等特点,在智能交通系统中取得了广泛的应用价值,例如车牌识别(车牌定位、车牌倾抖校正与字符分割、车牌字符识别变换等)和车辆检测与跟踪系统(包括感兴趣区域提取、车辆检测、车辆跟踪等),智能车辆导航、车型识别、交通控制等。
(5)航空航天通信――包括图像传输、电视电话和视会议等,主要是进行图像压缩甚至理解基础上的压缩。
(6)遥感技术――航空航天和卫星摇撼图像获取中和获取后都要用图像处理技术进行加工处理,提取出有利用价值的信息。主要用来对地形地质、矿藏资源搜索以及农业、水利、森林和海洋等资源调查研究,对自然灾害进行预测预报、检测环境污染、处理气象卫星云图以及识别地面军事目标。
(7)生物医学领域――图像处理在医学界的应用非常广泛,图像处理首先应用于细胞分类、染色体分类和放射图像等,临床诊断和病理研究中都大量接住了图像处理技术。它的直观、安全方便、无创伤的优点受到医生和患者的青睐。
(8)工业生产中的应用――在生产线中对产品及部件进行无损检测
(9)机器人视觉――机器视觉相当于智能机器人的重要感觉器官,可以对三维景物进行理解,医院、工厂、邮政以及家庭中的智能机器人,识别和定位装配线工件,太空机器人的自动操作。
(10)视频及多媒体系统――目前,电视制作系统中广泛使用图像处理、变换和合成技术,使电视效果更佳。在多煤体系统中广泛使用静止图像和动态图像的采集、处理、存储、传输和压缩,以达到使用者的目的。
(11)科学可视化――图像处理和计算机图形学的紧密结合,使科学研究得各个领域有了更为新颖的研究工具。
(12)宇宙探测――由于探索太空的需要和太空技术的快速发展,需要用数字处理技术来处理从外太空获取的大量星体照片。
(13)地质勘探――近年来发展起来的以数字图像处理技术为基础、综合多门学科知识的地学信息处理新技术的多源地学信息综合图像处理,使用一些特定的图像处理方法,实现了多源地学信息综合图像处理,用来辅助地质填图,构造地质研究,进行寸产资源的预测和评估,成为当前地质工作者正在研究和探讨的一个问题。
由图像处理技术在以上几个领域中的应用可以看出,图像处理技术在各领域中的重要程度:计算机图像生成技术在航空航海中可以充当仿真训练系统,还可以应用到广告和动画制作,跟友人将其应用到网游中;图像传输与通信还可在多媒体教学、网络视频领域得到广泛应用;在医学上,医学图像处理和材料分析也日益重要,如超声成像、X光成像、Y光成像以及核磁共振成像,对医生工作产生了巨大的辅助;图像跟踪和光学制导在战略技术武器中发挥了重要作用。
3.发展方向
随着计算机的发展,图像处理技术将越来越成熟,对各领域的影响也越来越大,总的来说,图像处理技术的发展有以下几个趋势:
(1) 在目前的基础上,图像处理速度越来越快,分辨率越来越高,多媒体应用光来月广泛,标准化、立体化程度越来越高,并产生智能化的趋势;
(2) 在目前二维基础上将出现多维成像的趋势;
(3) 芯片广泛运用到图像处理技术中,使用起来更加方便;
(4) 将出现新的算法与理论。
图像处理技术在各个领域的应用与发展,大大降低了相应领域的工作难度,效率更高,质量也无可挑剔,使人类受益匪浅。日后图像处理技术将进一步根据人类需求,在相关科研人员的努力奋斗下而实现新的突破,在更为广阔的领域造福人类事业。
参考文献
[1] 李红俊,韩冀皖.数字图像处理技术及其应用. 计算机测量与控制,2009.
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.
[3]杨枝灵,王开.Visual C++数字图像获取、处理及实践应用.人民邮电出版社,2003
篇4
1岩土力学的研究现状
岩土力学是近展起来的一门新兴学科,也是力学和地学相结合的一个基础学科。过去,工程中遇到的岩土工程问题,往往多凭经验解决,但工程实践表明,单凭经验越来越难以适应日益发展的工程规模和工程的复杂性,从而在工程设计中预测岩土工程的可靠性和稳定性,并使工程具有尽可能的经济性,这些巨大的工程建设问题,大大促进了岩土力学的发展。
岩土力学试验是岩土力学发展的基础,它包括实验室岩土力学参数的测定、现场岩体的原位试验及监测技术、岩体构造的测定等。随着试验设备和技术手段的提高,岩土力学的试验水平有了较大的发展,如常规的单轴拉伸、岩体弱面直剪试验、岩土应力应变破坏全过程试验和岩土流变等.
岩土损伤力学研究的重点是建立损伤变量和损伤扩展之间的本构关系,自从扫描电镜技术引入岩土损伤研究以来,我国学者在这方面进行了大量的研究工作。许江[1]等采用带有加载装置的光学显微镜进行了砂岩在不同加载阶段的损伤裂纹分析;孙钧等[2]采用带有微型加载装置的扫描电镜对岩土的微损伤扩展进行研究。这些研究有力地推动了岩体损伤力学的发展。另外,杨更社等[3]在岩土损伤CT识别方面进行了尝试性的研究。
分形几何由于可以很好地描述岩土力学中的不规则性和不确定性,在岩土力学领域得到了不同程度的应用。
2数字图像技术在岩土力学研究中的应用
2.1传统研究趋势的转变
随着岩石力学的发展,研究工作的重点已经从建立在均匀介质假设基础上的岩石宏观力学行为研究转向岩石内部细观和微观结构对其宏观力学性质影响的研究。岩石断面的数字图像包含了我们所关注的大量岩石细观信息,其处理技术也正随着计算机的发展日新月异。
近20 年来,数字图像处理(digital image processing ,简称 DIP)作为一种材料细观空间结构及几何形态的精确量测和数字表述手段快速地被应用于沥青混凝土、土和岩体的细观结构定量分析中[4]。特别是其在岩石工程中的应用为人们全面认识岩石的非均匀性、内部结构特征、各组分的形态特征及相应的细观力学特性开辟了新的道路
2.2数字图像技术在研究岩土力学方面的优越性
数字图像处理技术作为一种材料细观尺度上的空间结构精确测量和数字表述手段,已广泛应用于土、岩石及混凝土的细观结构定量分析中。应用数字图像处理进行的岩石细观力学研究是对岩石力学研究方法的革新数字图像量测技术是一种非接触无损量测技术,克服了接触量测容易对测量体造成扰动、破坏以及测量误差大、工作效率低等缺点,并且可以进行局部变形量测以及动态量测。
3 结论
随着岩石力学的发展,研究工作的重点已经从建立在均匀介质假设基础上的岩石宏观力学行为研究转向岩石内部细观和微观结构对其宏观力学性质影响的研究。岩石断面的数字图像包含了我们所关注的大量岩石细观信息,其处理技术也正随着计算机的发展日新月异。国内外发表的有关DIP 应用于岩石内部结构定量分析及细观力学计算的研究成果表明,DIP 具有传统测量和分析手段无可比拟的优越性:
(1)数字图像量测技术是一种非接触无损量测技术,克服了接触量测容易对测量体造成扰动、破坏以及测量误差大、工作效率低等缺点,并且可以进行局部变形量测以及动态量测,这些都是传统测量方法无法完成的。
(2)DIP 成功地表征了岩石的非均匀性,使我们可以方便、直观地研究岩石的不同矿物及结构对其宏观力学性质的影响,可以将岩石的岩性划分得更为具体,这将在岩土工程建设中发挥重要作用。
综上所述,数字图像处理为岩石内部细观介质的空间分布及变形进行精确测量和数值表述提供了可行途径,这意味着在理论上可以突破将岩石当作均匀介质的传统假设,从而深化对岩石宏观力学行为的本质认识。岩土工程的建设给岩土力学研究提出了许多挑战性的课题,为解决重大岩土工程面临的问题提供强有力的理论工具。
参考文献
[1] 许江,刘婧,程立朝等.压剪应力条件下砂岩双面剪切细观开裂扩展演化特性试验研究[J]. 岩石力学与工程学报, 2014, (4):649-657.
[2] 孙钧.岩土力学在我国的若干进展[J].西部探矿工程,1999,11(1):1-5.
[3] 杨更社.岩土损伤特性的CT识别[J].岩土力学与工程学报,1996,15(1):48-54.
篇5
1 研究背景
2003年4月,中国教育部了《关于启动高等学校教学质量与教学改革工程精品课程建设工作的通知》,提出精品课程是具有一流教师队伍、一流教学内容、一流教学方法、一流教学管理等特质的示范性课程。经过几年的推行实施,国家精品课程在数量上已具有一定规模,质量上也在逐年提高,但是在课程资源等方面仍然存在不足之处:(1)课程资源库建设。在《国家精品课程评价指标体系》中,课程资源主要是通过教学内容和教学条件两大项来评价,他们是课程的核心部分,是教学信息设计、组织与呈现等教学设计思想的具体化表现。经过这几年的努力,课程资源建设模块逐渐约定俗成,绝大多数课程均有课程介绍、教学大纲、教学安排、授课录像和试卷习题等,而实验/实践稍差,学习/教学指导、电子教材和素材库等最为薄弱;(2)课程资源类型。精品课程充分发挥现代教育技术强大功能,采用各种多媒体技术来呈现教学信息,如音/视频、PowerPoint、Word、Flash等,课程资源类型可以分为演示型、过程型、交互型、管理型和评价型5种,但是现在绝大多数课程都不重视过程型和交互型资源的建设,更是忽略知识管理型和评价型资源的建设[1]。
2 需求分析
精品课程网站的设计与开发,充分发挥计算机在呈现信息、提供联系、激发动机、学习评价方面等方面优势,弥补了教师、课本、视听媒体的不足;计算机作为使用者收集和组织信息、探究与批判性思考、合作与交流的工具,能很好的激发学习者的学习动机,促进有意义学习的发生;另外,精品课程的设计与开发,突破了时空限制,具有传播范围广的特点,任何人、任何时间、任何地点都可以按各自的兴趣选择任何课程进行学习。总之,精品课程网站的设计很好的适应了当今世界国际化、信息化、知识化等特征的要求,学习者能更好的实现自主学习。《遥感数字图像处理》是一门专业基础课,是以理论联系实践为主,注重运用,重视上机实践的一门课程。对于这样一门操作性较强的课程,设计与开发它的精品课程网站是非常有必要的。《遥感数字图像处理》精品课程网站的设计与开发依托了校级《遥感数字图像处理》精品课程的建设,面向遥感数字图像处理专业的学生,旨在辅助学生完成对本门课程的自主学习,实现学习效果的最优化,其目的是为了让学生通过学习,打牢遥感数字图像处理的基础知识,进而可以运用到实践中。通过该课程的学习,使学生树立正确的遥感数字图像处理的概念,培养学生良好的计算机实践习惯,实事求是的科学态度和严谨细致的工作作风,为后继课程的学习和将来参加社会生产实践打下基础。
3 主要技术简介
3.1 ASP技术简介
ASP是Microsoft Active Server Pages的简称,是服务器端脚本编写的环境,可以创建和运行动态、交互的Web服务器应用程序,即可以组合HTML页、脚本命令和Web页和基于Web的功能强大的应用程序。ASP不是一种语言,它所使用的语言是Javascript或VBScript,或者是这两种语言的结合体。总的来说,ASP具有以下的特点:(1)使用简单易懂的脚本语言(Javascript或VBScript等),结合HTML就可以快速开发出各种各样的应用程序;(2)不需要编译,容易编写,而且代码在服务器端直接执行;(3)ASP源程序在服务器端被执行后,将执行结果返回给客户端,从而提高了源程序的安全性;(4)可使用服务器端脚本来产生客户端脚本;(5)由于ASP程序在服务器端执行,因此只要客户端使用的浏览器可以执行HTML代码即可。这样便最高限度地保证了ASP程序的通用性;(6)可以使用VB等多种编程语言来开发ActiveX服务器组件来扩充服务器端程序的功能;(7)使用普通的文本编辑器即可对ASP程序进行设计、修改;(8)ASP提供了几种内置对象使得脚本功能更强大,在其他方面,这些对象完成从浏览器中检索或向浏览器发送信息的功能。总之,ASP是目前网页制作技术中最容易学习、灵活性也最大的工具之一。更重要的是它拥有非常好的可扩充性。像标准的HTML文件一样,ASP包含可以被Web浏览器显示并解释的HTML标签。通常放入HTML文件的Java小程序、闪烁文本、用户端脚本、用户端ActiveX控件都可以放入Active Server Pages中[4]。
3.2 ACCESS技术简介
Microsoft Office Access(前名 Microsoft Access)是由微软的关联式数据库管理系统,是 Microsoft Office的主要成员之一。Access能够存取 Access/Jet、Microsoft SQL Server、或者任何ODBC兼容数据库内的资料。Access 数据库由七种对象组成,它们是表、查询、窗体、报表、宏、页和模块。
表(Table)―是数据库的基本对象之一,是创建其他对象的基础。表由记录组成,记录由字段组成,表用来存贮数据库的数据,因此又称数据表。
查询(Query)―查询可以按索引查找到需要的记录,按要求筛选记录并能连接若干个表的字段从而组成新表。
窗体(Form)―窗体提供了一种方便的浏览、输入及更改数据的窗口。还可以创建子窗体显示相关联的表的内容。窗体也称表单。
报表(Report)―报表的功能是将数据库中的数据汇总,然后打印,以便
分析。
宏(Macro)―宏相当于DOS中的批处理,用来自动执行一系列操作流程。Access列出了一些常用的操作以方便用户选择,使用起来十分便捷。
模块(Module)―模块的功能和宏相似,但其操作比宏更加精细和复杂,用户可根据自己的需求编写程序。
页―是特殊的直接连接到数据库中数据的一种WEB页。通过数据访问页可将数据到Internet 或Intranet上,而且可以适用浏览器进行数据的维护和操作。
参考文献
[1] 许坦,石.精品课程发展现状综述[J].中国电化教育,2007(5):244.
篇6
Abstract:DSP hardware based license plate recognition system characteristics, analyzes plate region improved positioning algorithm, character segmentation algorithm to improve the efficiency of the license plate recognition.
Key Words:license plate identification;DSP;algorrithm
1 引言
据公安部相关数据统计,现如今我国汽车保有量已达2.4亿辆,且每年的增长率都在15%以上,应用智能交通系统来解决随之产生的交通问题已是大势所趋。基于DSP的车牌识别方法是智能化车牌识别的有效方法。现如今,自动车牌识别技术已被广泛应用,但由于算法的复杂性与效率的矛盾,及算法于系统上的应用的困难性,对车牌识别的关键算法还有待于更深入的研究。
2 硬件系统结构
通用可编程的DSP芯片的硬件技术的发展给数字图像处理带来了飞跃性的进步。要实现车牌识别,需要数字图像处理技术中的很多复杂的算法,基于DSP的车牌识别系统也因此得到了广泛的研究与应用。为了提高整个系统的可操作性及性价比,当前应用最多的是分布式的处理模式,即联合PC机与DSP的优势共同完成车牌识别系统,其总体结构及具体结构如(图1)所示:
3 车牌识别关键算法
算法流程为图像预处理、车牌定位、车牌分割,最后字符识别。图像预处理为提高摄像机摄取的图像质量,便于后续处理。利用DSP技术在处理车牌识别关键算法中的车牌的定位与字符分割方面优势显著。
3.1 车牌定位
基于灰度图像的定位技术日趋成熟,但彩色图像包含了图像的更多信息特征,加之车牌的底色是有规律可循的,所以基于彩色图像的定位技术越来越成为在发展定位技术上的突破点。本文定位的思路为:
(1)图像从RGB空间转换到HSI空间,其算法为(以蓝底白色车牌为例):
(3)对二值图像进行水平投影[1],从车牌固有的矩形特征中的高度特征提取车牌图像,如图3所示。再使用特征颜色边缘检测法,检测车牌正确位置,如图4所示。
(4)根据车牌固有的矩形特征中的宽度特征,使用垂直投影法提取车牌图像,如(图5)所示:
3.2 字符分割
字符分割是字符识别的关键前提。在2013年新交通法规中规定,对故意遮挡、污损、不安规定安装车牌的扣12分的处罚,这项规定的出台,也间接降低了算法的复杂性。本文采用车牌字符间隔的特征在垂直投影中的规律来进行字符分割。
其算法原理为:
(1)设垂直投影值为T,阈值为V,在确定前还要充分考虑字符粘连、断裂及“1”字符的特殊性。当时,T=0。
(2)设数组为从左向右扫描的投影值,当扫描的数组的值时,字符的宽度设为。根据规律[2],单个字符的宽度约为45mm,除第2、3字符的间隔为34mm,其它字符的间隔均为12mm。由此,得出以下3中情况:
(1)时,为字符粘连,取为单个字符的宽度;
(2)且后面的字符也如此时,为字符断裂,合并这两个字符;
(3)且不满足字符断裂,此字符为数字“1”。
实验结果如(图6)所示:
4 结语
本文在以DSP处理器TMS320DM6437嵌入式系统上对以上两大关键算法进行实验研究,在150张不同类型的车牌进行识别后,测试结果的正确率92.3%,且处理的速度达到实时处理的需求。为以后在智能交通控制系统中的车牌识别技术的提高和发展提供了参考基础。
参考文献
篇7
中图分类号:TP319
文献标识码:A文章编号文章编号:16727800(2017)005004704
0引言
图像识别是一项利用计算机对图像进行处理、分析和理解,以识别各种不同模式目标和对象的技术[1]。图像识别技术目前还不能达到人类的认知水平,但在特定应用环境中,可以通过模式识别或者神经网络的方法来对图像中的事物进行分类判断。一般而言,一个数字字符识别系统主要由3个部分组成,如图1所示。
图1系统组成
其中,预处理模块将图片格式(例如JPG格式)转换为计算机能识别的二进制数据流;图像处理模块则实现图像采集与转换、边缘提取、归一化等功能;字符识别模块可以由两种方法实现:模式识别或者神经网络方式,本文系统采用神经网络方式。
1识别目标及预期结果
此系统识别目标是在没有强干扰下,系统能够准确识别出图片中的0~9这10个数字。示例图片如图2所示。
系统识别中所用到的含单个数字的图片取自图2,均为纯色背景(不一定必须为白色背景)图片,且图片中数字图像无较大噪声干扰。系统经过一系列处理后,能成功识别,给出识别结果,并且给出处理过程中各个阶段的图片,以便更好地理解图像处理过程。
2预处理
预处理是将图片二值化的过程。预处理的目的简单来说就是把彩色图片处理为计算机更好处理的二进制数据流。预处理的过程主要分两部分:彩色图转灰白图,灰白图转二进制矩阵形式数据。
目前用于彩色图转换为灰度图的基本算法主要有:最大值法、平均值法、加权法,本文采用加权法。加权法的主要思想是设当前像素的三分量分别为R,G,B,然后利用公式(1)得到转换后的像素分量值:
GRAY=0.3*R+0.59*G+0.11*B(1)
在MATLAB中,函数img2gray就是采用加权法实现的。图像二值化就是将图像像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。二值化的处理过程是将图像中有意义的特征和需要应用的特征进行分割,利用前景和背景灰度特性的差异,低于阈值的像素设定为一个灰度值,高于阈值的像素设定为另一个灰度值。这样可将前景色与背景色以明显差异的灰度级区分开来[2]。阈值选取有手动选取和自适应选取两种方法。MATLAB中图像二值化的实现主要依靠im2bw函数来实现。图像二值化过程中,最重要的是阈值变换。比如数组a=[120,254,0,200,99],设定一个阈值125,并对a进行阈值变换,那么a中凡是大于125的,则变为255,小于等于125的则变为0。具体对临界情况处理可能不同,不过MATLAB中im2bw函数是按照上述方法处理的。a经过阈值变换后变为[0,255,0,255,0]。在MATLAB中使用im2bw函数进行图像二值化处理时(将图像转换为二值图像),人为设定阈值并不总是十分有效。MATLAB工具箱提供了graythresh函数[3]。该函数使用最大类间方差法得到一个阈值,利用这个阈值进行图像二值化通常有效。
经过预处理后得到的二值化图像,还要经过一系列图像处理过程,才能用于神经网络训练。
3图像处理
图像处理的目的是将图片变为神经网络能处理的数据流。图像处理流程如下:
(1)利用梯度锐化。使得图像更加突出,以便分析。算法:当前点像素值与其下一个像素值之差的绝对值,加上当前点像素值与其下一行当前像素值之差的绝对值,如果结果大于阈值,则当前像素值置为此结果。
(2)去除离散噪声。利用递归方法查找当前像素8个方向是否存在黑色像素,这里设置连续长度为15,如果用递归方法得到连续像素值大于15,则认为不是噪声;相反,则认为是噪声,则置为白色像素。
(3)字符倾斜度调整。尽量保存每个字符的位置一致。
(4)分割字符。找出每个字符的区域,用矩形记录,记录每个字符矩形数据。
(5)字符归一化。根据图像预处理准备阶段设置的归一化标准,把每个字符的区域进行归一化,使得所有字符区域矩形一样大,只是位置不一样。
(6)字符紧密排列。把所有字符紧密排列,以备识别使用。
本文示例样本图片中只有单个数字,且无较大干扰,所以不需要去除离散噪声、字符倾斜度调整、分割字符和字符紧密排列等步骤。经过预处理的图像数据,只需要进行锐化和归一化处理,就可以用于神经网络训练。
图像梯度锐化的目的是使原来的模糊图像变得清晰。MATLAB中使用的梯度函数为gradient函数。Gradient(F)函数求的是数值上的梯度,计算规则:[Fx,Fy]=gradient(F),其中Fx为其水平方向上的梯度,Fy为其垂直方向上的梯度,Fx的第一列元素为原矩阵第二列与第一列元素之差,Fx的第二列元素为原矩阵第三列与第一列元素之差除以2,以此类推,如公式(2)。
最后一列则为最后两列之差。同理,可以得到Fy。
归一化就是把需要处理的数据经过处理后(通过某种算法)限制在要求范围内。对于图像处理中的w一化而言,就是将所有数字图像中的字符归化成为一个具有同一高度、同一宽度的图像,也即让其中的字符具有同样规格。MATLAB中用于实现图像矩阵归一化功能的函数是mat2gray函数[5]。该函数在数字图像处理中经常用到,归一化的具体流程如图4所示。
经过归一化处理之后的图片数据,将其存储在一个矩阵中,用于神经网络的训练。
4神经网络训练
人工神经网络算法主要有两种:一种是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器[6];另一种方法是直接把待处理图像输入网络,由网络自动实现特征提取直至识别出结果。前一种方法识别结果与特征提取有关,而特征提取比较耗时。因此,特征提取是关键。后一种方法无需特征提取和模板匹配,随着相关技术的进步,这种方法更实用。
神经网络有许多种,在MATLAB中已经有集成神经网络工具箱。本文系统中,对数字图像的识别采用BP神经网络来进行训练。BP神经网络为前馈神经网络,网络的学习状态为有导师学习状态。它是一种具有学习能力和记忆能力的神经网络,主要由输入层、中间层、输出层3个部分组成。输入层、中间层和输出层可以具有不同数量的节点,具体数量随需求而定,没有具体的标准。单层神经网络结构如图6所示。
BP神经网络是误差反传误差反向传播算法的学习过程,由误差的反向传播和信息的正向传播两个过程组成[7]。输入层各神经元首先接收来自外界的输入信息,然后传递给中间层各神经元;输入信息经过中间层内部信息处理,实现信息变换,按照信息变化能力需要,中间层可以布局成多隐层或者单隐层结构;最后,一个隐层传递把信息传递给输出层,通过进一步处理,实现一次学习的正向传播处理过程,输出层把信息处理结果输向外界。当输出结果和预先期望效果不符时,就进行误差反向传播。误差通过输出层,根据误差梯度下降的方式改变各层权值,由隐层向输入层依次反传。多次交替的信息正向传播和误差反向传播过程,是各层连续修正的过程,也是神经网络学习训练的过程,这个步骤一直执行到最终输出的误差降低到能够接受的范围,或者预先输入的学习次数为止。
此系统中所使用的神经网络在中间层设置25个节点,1个输出节点。此系统采用三层神经网络来实现。采用s型对数函数logsig作为隐含层各神经元的传递函数,并采用纯线性函数purelin作为输出层各神经元的传递函数。此神经网络的训练函数采用traingdx,学习模式函数为learngdm。训练步数最长设为5 000,性能目标设为0.001。
神经网络模块的部分代码如下:
net=newff(pr,[25 1],{'logsig' 'purelin'},'traingdx','learngdm');
net.trainParam.epochs=5000;
net.trainParam.goal=0.001;
pr为前面图像处理所获得的矩阵数据。
神经网络的训练结果如图7所示。神经网络的性能曲线如图8所示。
5用艚换
考虑到该系统具有一定交互功能,让用户能自主选择需要识别的图片,向系统中添加如下代码段:
test=input('请输入用于测试的图片编号:','s');
x=imread(test,'jpg');
开始运行时,会提醒用户选择需要识别的图片编号,效果如图9所示。
用户输入需要识别的图片序号后,系统给出识别结果和图像处理各阶段中的图片,此处用subplot函数来实现一个窗口中显示多张图片的效果,部分代码如下:
6结语
通过样本识别验证,本文数字识别系统具有一定识别精度。本系统基本做到样本图片的100%识别,对于其它只有单数字的图片,经过训练之后,也能准确识别。本系统实现了部分人机交互功能,能让用户自主选择需要识别的图片,并输出识别结果和各个处理过程中的图片。
参考文献参考文献:
[1]冈萨雷斯.数字图像处理(MATLAB版)[M].阮秋琦,译.北京:电子工业出版社,2006.
[2]梁路宏,艾海舟,徐光佑,人脸检测研究综述[J].计算机学报,2002,25(5):449458.
[3]罗华飞.MATLAB GUI设计学习手记[M].北京:北京航空航天大学出版社,2009.
[4]聂影.MATLAB软件应用研究[J].软件导刊,2014,13(7):102104.
篇8
近年来,机器人视觉导航技术有了很大的发展。移动机器人的工作环境可能比较复杂,因此,提高图像识别的准确性以实现移动机器人的准确定位是移动机器人完成其导航任务的首要前提;同时,由于移动机器人在导航过程中需要实时的采集并分析图像信息,从而实现对作业环境的识别以进行准确的路径跟踪。因此,如何在提高图像识别的准确性的同时达到较好的实时性是移动机器人视觉技术的一个发展方向
1.图像处理
数字图像处理,是对数字图像信息进行加工以满足人的视觉心理或应用需求的行为,数字图像处理的英文名称是"Digital Image Processing'',通常所说的数字图像处理是指用计算机对图像进行的处理,因此也称为计算机图像处理。图像处理就是用一系列的特定操作来改变图像的像素,以达到特定的目标,比如使图像更清晰,或者从图像中提取某些特定的信息等。
CCD摄像头的主要工作原理具体而言,就是摄像头连续地扫描图像上的一行,输出就是一段连续的电压视频信号,该电压信号的高低起伏正反映了该行图像的灰度变化情况。当扫描完一行,视频信号端就输出低于最低视频信号电压的电平(如0.3v),并保持一段时间。这样相当于,紧接着每行图像对应的电压信号之后会有一个电压"凹槽",此"凹槽"叫做行同步脉冲,它是扫描换行的标志。然后就需要跳行,跳过一行后(因为摄像头是隔行扫描的方式),开始扫描新的一行,如此下去,直到扫描完该行的视频信号,接着就会出现一段场消隐区。此区中有若干个复合消隐脉冲,其中会有个脉冲远宽于(即持续时间长于)其它的消隐脉冲,该消隐脉冲又称为场同步脉冲,它是扫描换行的标志。场同步脉冲标志着新的一场的到来,不过,场消隐区恰好跨在上一场的结尾部分和下一场的开始部分,要等到场消隐区过去,下一场的视频信号才真正到来。摄像头每秒扫描25幅图像,每幅又分奇、偶两场,先奇场后偶场,故每秒扫描50场图像。奇场时只扫描图像中的奇数行,偶场时则只扫描偶数行。
选择一款具有全电视信号输出的黑白CCD图像传感器,用LMl881进行信号分离,结合A/D采样,实现了视频信号的采集。在总线周期为400M的情况下,每行采集72个有效数据,摄像头每场信号有320行,其中第23到310行为视频信号。我们从中均匀采集了24行,最后得到一个24×72的二维数组。
CCD采集的原始数据包含了黑线的位置信息,为了稳定可靠地提取这一信息,有一下几种方法:
(1)二值化算法
算法的思路是:设定一个阈值value,对于视频信号矩阵中每一行,从左至右比较各像素值和阈值的大小。若像素值大于等于阈值,则判定该像素对应的是白色道路;反之,则判定对应的是目标指引线。记下第一次和最后一次出现像素值小于阈值时的像素点的列号,算出两者的平均值,以此作为该行上目标指引线的位置。该算法的思想简单,具体实现时还可以一旦检测到左边缘后就退出该行扫描,这样上面的流程图将变得更加简洁。但是这种提取算法鲁棒性较差,当拍摄图像中只有目标指引线一条黑线时,还能准确提取出目标指引线。但当光强有大幅度的变化,或图像中出现其它黑色图像的干扰时,并且离机器人比较近的黑线比较的明显,离机器人越来越远时黑线越来越淡,该算法提取的位置有可能与目标指引线的实际位置偏离较大。
(2)直接边缘检测算法
算法的思路是:设定一个阈值,对于视频信号矩阵中每一行,从左至右求出相邻两像素值的差值(左减右)。若差值大于等于阈值,则判定下一个的像素点对应的是目标指引线的左边缘,以此像点作为该列的特征点,记录下此像素点的列号,作为该行上目标指引线的位置。当然,可能出现差值始终小于阈值的情况,此时一种方法是令该行上目标指引线位置为0,通过进一步滤波或拟合来修正;另一种方法是让该行上目标指引线位置和通过上一场视频数据求得的位置一样。
该算法较二值化方法而言,抗环境光强变化干扰的能力更强.同时还能削弱或消除垂直交叉黑色指引线的干扰。因为该算法在视频信号矩阵中是由左至右来寻找目标指引线的左边缘的,所以当黑色图像出现在目标指引线左方时,该算法无法排除干扰,而当其出现在右方时,则可以排除干扰。
(3)跟踪边缘检测法
这种算法跟直接边缘榆测算法一样,也是寻找出目标指引线的左边缘,仍然用左边缘的位置代表目标指引线的位置。但跟踪边缘检测从视频信号矩阵每行中寻找左边缘的方法与直接边缘检测法不同。
因为目标指引线是连续曲线,所以相邻两行的左边缘点比较靠近。跟踪边缘检测正是利用了这一特性,对直接边缘检测进行了简化。其思路是:若已寻找到某行的左边缘,则下一次就在上一个左边缘附近进行搜寻。这种方法的特点是始终跟踪每行左边缘的附近,去寻找下一列的左边缘,所以称为"跟踪"边缘检测算法。
在首行边缘检测正确的前提下,该算法具有较强的抗干扰性,能更有效地消除垂直交叉黑色指引线的干扰,以及指引线外黑色图像的影响,始终跟踪目标指引线。
另外,较之前两种算法,跟踪边缘检测算法的时间复杂度更低,因此效率更高。但值得注意的是第一行的左边缘位置对整个目标指引线的搜寻影响 很大,一旦它的位置和实际导引线偏差较大,就会产生一连串的错误,这是不可容忍的。
通过比较本系统选择了效率更高,更可靠的跟踪边缘检测法。流程图如图所示:
2.结论
本文中图像处理和路径信息识别的方法,并对不同时刻不同位置采集到的图像的处理效果进行比较研究,结合实际环境中的图像特点,确定出适合于本研究的图像处理算法。提出了改善路径信息辨识速度和精度的方法。
参考文献:
[1]张文志,吕恬生.基于改进的遗传算法和模糊逻辑控制的移动机器人导航[J].机器人.2003,
25(1):1
[2]邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报.2000,26(1):44-45
篇9
近年来,人们提出了许多方法用于检测和跟踪序列图像中的运动目标,但是由于受到计算机速度和算法复杂度的限制,使得在检测和跟踪运动目标的实时性和鲁棒性方面总是不太理想。同时在设备不断小型化、集成化、网络化的今天,FPGA由于其可编程的特点成为嵌入式开发的最佳平台。因此,本设计核心模块为Altera公司的Cyclone系列FPGA EP4CGX150DF3117N核心处理器,以提高系统的整体的性能。[1]
2 系统工作流程和原理
系统主要由一体化摄像机、高速数字云台、视频解码器SAA7113H、图像存储器SRAM,FPGA控制器、以太网模块、监视器、报警模块等部分构成。
该跟踪系统的工作过程为:系统开机后FPGA加载程序,然后根据算法对采集到的图像进行处理,获得控制云台的参数并传递给云台控制器,从而跟踪目标运动。具体实现过程:摄像头安装在跟踪转台上,摄像头输出的电视制式的信号(含有图像和同步、行场消隐信号)一路送到监视器上进行实时监视,另一路经过视频预处理,经过SAA7113变换后送入图像处理单元FPGA进行图像处理,图像处理单元首先形成一个检测(波门)窗口,然后在窗口中检测、识别、提取出目标图像信号,确定出目标在当前帧观测图像中的精确坐标,经计算得到相对于摄像头瞄准线的偏差量,送至伺服机构,云台输出控制信号控制步进电机转动,带动云台上的摄像头转动,使目标始终处于视场中心,从而达到跟踪的目的[2]。通过以太网上传目标坐标数据,用于进一步分析。
3 装置硬件的具体实现
本装置对核心处理器、视频解码芯片,以太网模块等器件的选择关系到整个装置的性能和价格,即选择性能价格比高且能满足设计需要的器件。
3.1核心处理器选择
处理器需要根据算法及实际被测目标对处理能力的要求来选择。目前的处理器主要有单片机、ARM、DSP、FPGA等等。本装置核心模块主要是Altera公司的Cyclone系列FPGA EP4CGX150DF3117N,该芯片有149760个逻辑单元,RAM 635520 bit, 8个锁相环,用户I/O 508个,芯片具有很高的性价比,还支持SOPC ,从而完成各模块功能,并协调整个系统工做。芯片功能很强大,为以后系统升级,算法改进,数据量增大提供很大空间。
3.2 视频解码芯片SAA7113 和以太网W5100配置
为了使视频解码芯片SAA7113H可以按照预想的方式工作,需要对其进行初始化,视频解码芯片为I2C串行总线,在上电后首先修改SAA7113H的内部寄存器的数值,进行正确初始化[3]。
W5100是一款多功能的单片网络接口芯片,内部集成10/100以太网控制器,内部集成为全硬件形式,且具有经过多年市场验证的TCP/ IP协议栈,太网介质传输层MAC和物理层PHY 硬件,TCP/IP等协议已经在很多领域经过多年验证[4]~[5]。
W5100内部集成有16KB的存储器用于数据传输,使用W5100不需要考虑以太网的控制,只要进行简单的端口SOCKET编程。此外,其接口非常简单,可选择SPI接口。
对上述两个模块的设计采用SOPC方法,SOPC是一种用于嵌入式开发的片上可编程系统,设计灵活,可剪裁,可升级软硬件在系统可编程的功能,运用FPGA 的NIOS II 对 I2C,对SPI口配置过程为:运行QUARTUS II 软件中的SOPC BUILDER 添加I2C,SPI 模块,从而构成功能强大的32位NIOS嵌入式系统。
4 目标的跟踪定位
确定目标位置的方法分两类,即波门跟踪和相关跟踪算法。本文采用形心跟踪算法,该算法对跟踪窗内的数字图像处理得到一阈值,再从跟踪窗内的数字图像中分割出目标像元,然后根据分割出的全体目标像元位置数据和目标像元的点数,计算出目标的形心,目标的形心相对于视场中心的位置数据则作为目标偏差数据[6]。
5 结论
本文介绍了一种移动目标跟踪装置。该装置是以ALTERA公司的FPGA芯片EP4CGX150DF3117N为核心处理器。通过以太网上传的跟踪信息来看,看该系统取得了较好的跟踪效果,实验结果证明该装置能够很好的适应目标检测和跟踪算法,该装置对运动目标监视和跟踪产品有一定的参考意义。
参考文献
[1]杨宜禾,周维真.成像跟踪技术导论[M].西安电子科技大学出版社,1992.
[2]王栓,艾海舟,何克忠.基于差分图像的多运动目标检测与跟踪[J].中国图形图像学报,1994(6).
[3]郝迎吉,刘青,徐凌志.基于EPP和FPGA的CMOS图像传感器的数据采集[J].电子设计应用,2002(01).
[4]黄钉劲,阮照军,王刚,郭小莉.基于FPGA的图像采集与远程传输系统设计[J].西安工业大学学报,2008.
[5]放璐,杨天怡,牟万军.数字图像远程监控系统的组网方式[J].电子产品世界,2002(21).
篇10
1993年Mallat和Zhang提出了信号的稀疏表示,在信号逼近上取得了出色的表现,迅速引起了广大学者的普遍关注,信号稀疏表示研究很快被从一维信号推广到二维信号图像的研究上。
稀疏表示的模型可以表示为:
式中为向量的l0范数,表示向量x中非零元素的个数,x即为信号y的稀疏表示。
在数字图像处理中,由于图像的数据信息具有冗余性,为冗余字典,因此可以在冗余字典上进行稀疏表示,y则为图像子块的列向量表示。如何构造表达能力强、训练简单的冗余字典是图像处理中的关键一步,自稀疏表示理论的提出,在图像去噪、去模糊、超分辨率、图像修复等方面得到了广泛的应用,取得了比传统方法更好的处理结果。
1 稀疏表示理论在提高数字图像质量中的应用
Michael Elad是较早将稀疏表示理论应用于图像去噪与超分辨率的代表人物[1],他将K均值聚类方法引入字典训练过程中。在K均值算法中,求解一个包括K个代码的码本,使得在此码本上,根据最邻近分配法则,对包含N个信号的集合进行分类,得到最佳分类。在稀疏表示中,稀疏表示的过程可以看做广义矢量量化过程,其中的每个信号用多个代码的线性组合表示。当要求K-SVD中的每个信号只能用一个原子来近似时,K-SVD算法就退化为K均值算法。K-SVD在稀疏编码与字典更新之间交替迭代,保证总误差单调下降,因此可保证能收敛到局部(或全局)最小值,从而得到性能优良的过完备字典。K-SVD训练字典方法广泛的应用在图像复原问题上。基于K-SVD训练得到的过完备字典,取得了较好的图像去噪与超分辨率结果。
统计学中的主成分分析(PCA)的概念,也被引入到字典训练当中。在统计学当中,变量个数太多会增加问题的复杂性主成分分析作为一种统计分析方法,它可以从多元事物中解析出主要影响因素,简化复杂问题。PCA的核心思想,就是将高维数据投影到低维空间。寻找 r 个新变量,使其反映事物的主要特征,每个新变量是原有变量的线性组合,体现原有变量的综合效果,则这 r 个新变量称之为“主成分”,它们两两正交不相关。这 r 个主成分可以在很大程度上反映原来变量的信息。Hui Zou引入了SPCA(Sparse PCA)的概念,他修改了传统的PCA方法,利用主成分负载的稀疏性,使算法变得更加易懂,且得到更为稀疏的结果。
形态学成分分析(MCA)作为一种新兴的信号分解方法,吸引了很多人的注意。MCA根据图像信号组成成分的形态差异性,将图像内容分割为纹理区域和卡通区域。不同区域其拟合字典类型不同。小波变换可以很好的表示图像光滑区域的特征,curvelet变换通过带方向的局部傅里叶基,可以有效的处理边缘特征。离散余弦变换(DCT)以及Gabor变换是纹理区经常采用的两种处理方式。MCA充分的考虑了图像的结构组成部分以及内部特征,广泛用于盲源分离、图像分解、图像修补等。
Julien Mairal将自然图像的自相似性引入到图像恢复模型中。图像的自相似性,其根本是自然图像的统计特征。Julien Mairal非局部模型与稀疏编码结合成一个框架,将噪声在相似块之间进行平均,取得了较好的去噪、去马赛克结果。同样,自相似性在图像去模糊、图像修补方面也展示了其良好的性能。
Weisheng Dong提出了一种新的图像复原模型CSR,利用减小退化图像分解系数与原图分解系数之间的差异来达到复原图像的目的,其本质是自相似性的应用。在超分辨率方面,他提出了自适应稀疏域选择超分辨率算法,认为超分辨率重建结果的优劣很大部分取决于稀疏域的选择,对输入的样本先采用K-均值聚类,采用PCA算法进行词典训练,将非局部相似性(NL)和图像去噪中的自回归(AR)模型与超分辨率重建模型有效结合,提高了超分辨率重建质量。
Nebojsa创造性的提出了图像摘要的概念。他将图像的特征提取为一幅摘要图,在图像处理过程中,对该摘要图进行分解处理,这是合理并且有效的。Louise 利用该思想,在图像去噪方面取得了较好的去噪结果。
Kostadin在变换域,通过一组协作滤波器,将一幅图像中结构相似的二位块聚合成一组,形成一个三维模型,以增强其表示的稀疏性。Aram利用该3D理论,建立了一个新的图像模型―BM3D。BM3D在图像复原方面表现了其卓越的性能。
最近,保持图像几何结构的思想吸引了很多人的注意。Samy Bengio将图像分割成相互重叠的块,结构相似的块组成一个群组,分别对每个组进行分解训练,这就是群组编码的思想,其基本思想类似于非局部思想,也是利用了自然图像的自相似性。关于结构稀疏方面的研究展示了结构分组比简单不重叠的分组更一般的特性。例如,树状分组或是重叠分组。结构稀疏正则化具有十分广阔的应用前景。结构稀疏PCA作为一种新型的有效的非凸稀疏方法,在字典训练方面,可以取得较为理想的结果。
纵观稀疏表示理论出现以后的图像处理论文,广大研究者着重于研究如何获得表示能力强的冗余字典,以及通过结合多重约束,如平滑约束,相似性约束,几何结构不变性约束等来得到高质量的图像,近年来取得了很大的进展。但是稀疏表示属于一种优化问题,涉及到字典学习和稀疏求解的计算过程比较复杂,因而对于该理论在图像的实时处理上受到了限制,因此如何缩短计算时间也是这个模型急需解决的问题。
2 结语
篇11
Image Stitching Technology Overview
Cai Jian
(Nanjing University of Aeronautics and Astronautics,Nanjing210016,China)
Abstract:Today,more and more high-resolution digital images for domestic,industrial,medical and defense technology applied.With computer vision,image processing technology,using an ordinary camera computer digital image composition as a large high-resolution images of the image stitching technology came into being.
Keywords:Image;Stitching technology;Overreview
而在人们的实际生活应用中,所需要的目标场景往往超出普通数码相机、监控摄像机等的视角范围。这些相机,往往在增大视角会降低采集图像的精度,而提高精度又只能窥豹一斑。因此,为了得到应用所需的高分辨、大视角的图像,人们不得不使用广角镜头和全景拍摄相机,这加大了生产、生活的成本,且使用技术不为一般人所能熟悉。所谓图像拼接技术,就是将数张有重叠部分的图像(可能是不同时间、不同视角或者不同传感器获得的)拼成一幅大型的无缝高分辨率图像的技术。图像拼接的流程大致分为:获取待拼接的图像,进行图像预处理,图像重叠区域配准,图像的无缝融合,输出所得拼接图像。其中,图像配准和图像融合是图像拼接成功的关机,是拼接的关键技术。因此,国内外学者多围绕此两项技术展开研究和讨论。
图像配准是图像融合的基础,而且图像配准算法的计算量一般非常大,因此图像拼接技术的发展很大程度上取决于图像配准技术的效率。
一、图像拼接的应用价值
目前,图像拼接技术已经数据图像处理研究的热门方向之一,被广泛地应用在文物保护(古迹、古文字资料的拼接)、工业监控、刑事案件侦破、医学图像分析、摄影测量学、机器视觉、虚拟现实技术、超分辨率重构、军事地形图像生成等领域,有着实际的应用意义和研究价值。主要表现为:
(一)全景图和超宽视角图像的合成。将普通图像或视频图像进行无缝拼接,得到超宽视角甚至360°的全景图,这样就可以用普通相机实现场面宏大的景物拍摄;
(二)碎片图像的组合。将医学和科研的显微碎片图像或者空间、海底探测得到的局部图像合成大幅的整体图像;
(三)虚拟现实。图像拼接是虚拟现实领域里场景绘制(Image-based Rendering,IBR)方法中的一项基本技术,利用图像拼接技术可以生成全方位图像,用全景图表示实景可代替3D场景建模和绘制。
例如2003年,美国“勇气号”和“机遇号”火星探测器发回了大量的火星地面照片,科学家们就是运用图像拼接技术合成了火星表面的宽视角全景图像。
二、图像拼接的方法
图像拼接的方法很多,不同的算法步骤会有一定差异,但大致的过程是相同的。一般来说,图像拼接主要包括以下步骤:
(一)图像预处理。包括数字图像处理的基本操作(如去噪、边缘提取、直方图处理等)、建立图像的匹配模板以及对图像进行某种变换(如傅里叶变换、小波变换等)等操作。
(二)图像配准。就是采用一定的匹配策略,找出待拼接图像中的模板或特征点在参考图像中对应的位置,进而确定两幅图像之间的变换关系。
(三)建立变换模型。根据模板或者图像特征之间的对应关系,计算出数学模型中的各参数值,从而建立两幅图像的数学变换模型。
(四)统一坐标变换。根据建立的数学转换模型,将待拼接图像转换到参考图像的坐标系中,完成统一坐标变换。
(五)融合重构。将带拼接图像的重合区域进行融合得到拼接重构的平滑无缝全景图像。
三、国内外研究现状
1975年,Kuglin和Hines提出了相位相关算法,该方法具有场景无关性,能将纯二维平移的图像进行精确对齐。1987年,De Castro和Morandi等人使用傅立叶变换将具有旋转变换的图像做对齐,由此产生扩展相位相关法。1996年,Reddy和Chaterji改进了De Castro的算法,基于快速傅立叶变换,利用极坐标和互功率谱,实现了具有平移、旋转和缩放变换的图像配准。
相位相关法虽然计算简单精确,但要求待配准图像之间有较大的重叠比率,同时计算量和适用范围与图像的大小有很大的关系。因此,出现了基于图像几何特征的配准方法。
1997年,Zoghlami I.、Faugeras O.和Deriche R.提出了基于几何角模型的图像对齐算法。1999年,Bao P.和Xu D.利用小波变换提取保留边(edge-preserving)的视觉模型进行图像的对齐,Nielsen F.则提出了基于几何点特征优化的匹配方法。
随着人们对图像的分析和理解的深入,图像拼接技术的研究也趋于成熟,图像拼接利用的配准特征也从图像的低级特征发展到利用高级特征。
1996年,Richard Szeliksi提出了基于运动的全景图像拼接模型,模型通过采用Levenberg-Marquardt迭代非线性最小化方法(L-M算法)求出图像间的几何变换关系进行配准。此算法效果好、速度快,且能应对平移、旋转和仿射等变换图像的拼接,因此成为图像拼接领域的经典算法。2000年,Shmuel Peleg、Benny Rousso等在其基础上,根据相机的不同运动,自适应的选择拼接模型,通过把图像分割成条进行多重投影,提出了自适应的图像拼接模型,使自适应拼接成为拼接领域研究的又一方向。
国内学者也对图像拼接技术做了大量研究。张祖勋提出了多级影像概率松弛整体匹配技术,对不同传感器、不同空间分辨率的影像进行配准。杜威、李华二人将视频纹理和全景图结合起来,提出一种应用于动态场景的全景图表示方法。赵向阳、独立民提出了基于Harris特征点匹配的自动拼接算法。侯舒维、郭宝龙采用简单的边缘信息阈值法、金字塔式分层搜索策略,提出了一种灰度图像上的快速自动拼接算法。方青、王博亮提出了一种基于比值模版匹配的彩色图像拼接算法。
参考文献:
篇12
Research and application of image segmentation technology
Wang Wei1, Zeng Xiaoneng2
(1. Changsha Information technology School, Changsha, Hunan 410116, China; 2. Central South University)
Abstract: Image segmentation is about decomposing an image into a number of mutually non-overlapping region while having the same attribute. It is a key technology of digital image processing, which directly affects the effectiveness of segmentation accuracy of subsequent tasks, hence having important significance. The existing segmentation algorithm achieved success to some extent, but the image segmentation problem is far from being solved, research in this area still faces many challenges. The existing problems of image segmentation methods are analyzed. The classical algorithm for image segmentation is improved. A new segmentation method is given and applied to the machine vision-related products which achieve good results.
Key words: digital image processing; image segmentation; segmentation algorithm; machine vision
0 引言
图像分割是数字图像处理中的一项关键技术,它通常用于对图像进行分析、识别、编码等处理之前的预处理环节,其分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。自上世纪70年代以来,已经出现了多种图像分割方法,而每一种图像分割方法都是为了解决一些特定的应用问题。该技术成功地应用于许多领域,例如:交通路口的电子警察、光学字符识别(OCR)、指纹识别、机动车牌号识别等等。
图像分割是指将一副图像分解为若干互不交叠的有意义且具有相同属性的区域。好的图像分割应具备的特性:①分割出来的各区域对某种性质如灰度、纹理而言具有相似性,区域内部比较平整;②相邻区域对分割所依据的性质有明显的差异;③区域边界上是明确和规整的[1]。
大多数图像分割方法只是部分满足上述特征。如果强调分割区域的同性质约束,则分割区域很容易产生大量小孔和不规则边缘;若强调不同区域间性质差异的显著性,则易造成不同区域的合并。具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。
虽然图像分割方法已经有了很大的发展,但由于它的复杂性,仍有很多问题没有很好地得到解决。因此,人们至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的分割结果。实践表明,对图像分割理论与技术的进一步研究仍然具有非常重要的意义。
本文首先对数字图像分割的一些经典分割方法作了概述,然后分析了现有项目开发中使用的图像分割方法所存在的问题,最后基于经典算法进行技术改进,实现了一种新的分割方法,并将其应用到实际的产品当中,取得了良好的效果。
1 图像分割方法的现状
从上世纪五十年代开始,学者一直热衷于研究图像分割技术。迄今为止,已提出上千种图像分割算法,依这些算法对图像处理的特点,主要可分为以下几类方法[2]。
1.1 阈值分割法
阈值分割法作为一种常见的区域并行技术,它通过设置阀值,把像素点按灰度级分若干类,从而实现图像分割。由于是直接利用图像的灰度特性,因此计算方便简明、实用性强。显然,阈值分割方法的关键和难点是如何取得一个合适的阈值,而实际应用中阈值设定易受噪声和光亮度影响。近年来关于阈值分割法主要有[3]:最大相关性原则选择阈值法、基于图像拓扑稳定状态法、灰度共生矩阵法、熵法、峰值和谷值分析法等。其中,自适应阈值法、最大熵法、模糊阈值法、类间阈值法是对传统阈值法改进较成功的几种算法。更多的情况下,阈值的选择会综合运用两种或两种以上的方法,这也是图像分割发展的一个趋势。例如,将图像的灰度直方图看作是高斯分布的选择法与自适应定向正交投影高斯分解法的结合,较好地拟合了直方图的多峰特性,从而得到了更为准确的分割效果。阈值法的缺陷主要在于它仅仅考虑了图像的灰度信息,而忽略了图像的空间信息。对于非此即彼的简单图像处理(如一些二值图像的处理)是有效的,但是对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题则难以得到准确的分割效果。
1.2 基于边缘的图像分割法
边缘总是以强度突变的形式出现,可以定义为图像局部特征的不连续性,如灰度的突变、纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始,图像的边缘包含了物体形状的重要信息,它不仅在分析图像时大幅度地减少了要处理的信息量,还保护了目标的边界结构。对于边缘的检测常常借助空间微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘,而这正是灰度值不连续的结果,这种不连续可以利用求一阶和二阶导数检测到。
当今的局部技术边缘检测方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果,但对于边缘复杂(如边缘模糊、边缘丢失、边缘不连续等)的图像效果不太理想。此外,噪声的存在使基于导数的边缘检测方法效果明显降低,在噪声较大的情况下所用的边缘检测算子通常都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者对图像进行局部拟合,然后再用拟合光滑函数的导数来代替直接的数值导数,如Marr算子、Canny算子等。有关学者曾给出了一种基于彩色边缘的图像分割方法,这是对传统边缘分割方法只适用于灰度图像状况的一个突破。
在未来的研究中,用于提取初始边缘点的自适应阈值选取、用于图像层次分割的更大区域的选取,以及如何确认重要边缘去除假边缘将变得非常重要。
1.3 基于聚类的分割法
对灰度图像和彩色图像中相似灰度或色度合并的方法称之为聚类,通过聚类将图像表示为不同区域即所谓的聚类分割方法。此方法的实质是将图像分割问题转化为模式识别的聚类分析,如k均值、参数密度估计、非参数密度估计等方法都能用于图像分割。常用的聚类分割有颜色聚类分、灰度聚类分割和像素空间聚类分割。
颜色聚类分割实际上是将相似的几种颜色合并为一色,描述颜色近似程度的指标是色差,在标准CIE匀色空间中,色差是用两个颜色的距离来表示的。但是显示器采用的RGB空间是显示器的设备空间,与CIE系统的真实三原色不同,为简单起见,一般采用RGB色空间中的距离来表示。
灰度聚类分割就是只把图像分成目标和背景两类,而且仅考虑像素的灰度,这就是一个在一维空间中把数据分成两类的问题。通过在灰度空间完成聚类,得到两个聚类中心(用灰度值表征),聚类中心连线的中点便是阈值。显然这个概念也可以轻松地延扩至多阈值和动态阈值的情况。
像素空间聚类分割在某些特定的尺度上观察图像,比如说把图像信号通过一个带通滤波器,滤波的结果将使图像的局部信息更好地被表达。通过一个多尺度分解,轮廓信息可以在大尺度图像上保留下来,细节或者突变信息可以在中小尺度上体现,基于多尺度图像特征聚类的分割方法渐渐得到了人们的关注。
1.4 函数优化法
基于函数优化的分割方法是图像分割中另一大类常用的方法,其基本思路是给出一个目标函数,通过该目标函数的极大化或极小化来分割图像,G.A.Hewer等人提出了一个具有广泛意义的目标函数。统计学分割法、结合区域与边缘信息法、最小描述长度(MDL)法、基于贝叶斯公式的分割法等是目前几种活跃的函数优化法。
统计学分割法就是把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,且观察到的实际物体是作了某种变换并加入噪声的结果。统计学分割方法包括基于马尔科夫随机场法(MRF)、标号法(Labeling)和混合分布法(Mixture)等。
结合区域与边缘信息法是基于区域信息的图像分割的主要方法。区域增长有两种方式:一种是先将图像分割成很多一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的;另一种是事先给定图像中要分割目标的一个种子区域,再在种子区域基础上将周围的像素点以一定的规则加入其中,最终达到目标与背景分离的目的。分裂合并法对图像的分割是按区域生长法沿相反方向进行的,无需设置种子点,其基本思想是给定相似测度和同质测度,从整幅图像开始,如果区域不满足同质测度,则分裂成任意大小的不重叠子区域;如果两个邻域的子区域满足相似测度则合并。
最小长度描述法(MDL)的基本思路是用一种计算机语言来描述图像的区域和边界信息,得到一个描述长度函数,以此作为目标函数,根据图像极小化描述长度从而得到分割结果。MDL准则主要应用于区域竞争中,即通过这种规则对比若干个种子区域,找出其中的坏种子。它常常与其他方法结合使用。
2 图像分割技术的研究与应用
2.1 图像扫描分割
根据实际产品的需要,要根据分割的特殊要求,采用简单的图像扫描分割。
2.1.1 算法思想
获取二值化要分割的图像,然后转换为图像指针并获取图像的左右边界、上下边界,然后再分割图像[4]。
2.1.2 分割过程实现
下面介绍基于FrameWork4.0,采用C#实现对图像进行分割处理的主要步骤。
⑴ 二值化要分割的图像
BaseFilterHandler.ImgConvertToFormat8(c_Bitmap);
BaseFilterHandler.ImgBradleyLocalThresholding(c_Bitmap);
⑵ 转换为图像指针并获取图像中的左右边界
BitmapData bmData=c_Bitmap.LockBits(new Rectangle
(0,0,c_Bitmap.Width,c_Bitmap.Height),ImageLockMode
.ReadWrite, c_Bitmap.PixelFormat);
List<int[]> widthLeftRight=GetImgLeftRight(bmData,
c_Bitmap, throldValue);
⑶ 获取图像的上下边界
int[] yValues=img.GetPicTopBottom(sourceMap, 1, sourceMap
.Height-2, widthLeft[widthLeftIndex],
widthRight[widthLeftIndex]);
top=yValues[0]; bottom=yValues[1];
⑷ 分割图像
Rectangle sourceRectangle0=new Rectangle
(widthLeft[widthLeftIndex],tempTop, widthRight
[widthLeftIndex]-widthLeft[widthLeftIndex], tempHeight);
Bitmap tempMap=sourceMap.Clone(sourceRectangle0,
sourceMap.PixelFormat);
2.1.3 实际效果
存在干扰情况下的分割效果,如图1所示。
<E:\方正创艺5.1\Fit201501\图\ww图1.tif>
图1 图像扫描分割
图像扫描分割的结果存在多干扰点,一些字符不能完整地被分割出来,多个字符连接在一起,分割效果不是很好。
2.2 findContours分割
2.2.1 算法思想
该算法是提取图像的轮廓信息,一个轮廓一般对应一系列的点,也就是图像中的一条线[5]。在算法中用序列cvSeq来保存提取到的序列集,序列中的每一个元素就是曲线中的一个点的位置。
2.2.2 分割过程实现
下面介绍采用C++实现对图像分割处理的主要步骤。
⑴ 图像的预处理(二值化、平滑处理等)
threshold(input,img_threshold,60,255,
CV_THRESH_BINARY_INV);
IplImage* input_image=&IplImage(img_threshold);
IplImage* dst_image=cvCreateImage(cvGetSize
(input_image),IPL_DEPTH_8U,0);
cvSmooth(input_image,dst_image,CV_GAUSSIAN,3,0,0,0);
⑵ 查找图像的联通区域及轮廓
Mat img_contours;
img_threshold.copyTo(img_contours);
vector<vector<Point>> contours;
findContours(img_contours, contours,
CV_RETR_EXTERNAL,CV_CHAIN_APPROX_NONE);
⑶ 对轮廓进行转换得到内容区域
vector<vector<Point>>::iterator itc=contours.begin();
IplImage* temp=&(IplImage)input;
vector<Rect> validRect;
while(itc!=contours.end()) {
Rect mr=boundingRect(Mat(*itc));
rectangle(result,mr,Scalar(0,255,0));
if(!checkSplitRect(mr,temp->height,temp->width))
{ ++itc;continue; }
validRect.push_back(mr);
++itc;
}
⑷ 图像分割
CvSize size=cvSize(rect.width,rect.height);
cvSetImageROI(source,cvRect(rect.x,rect.y,size.width,size.height));
IplImage* pDest=cvCreateImage(size,source->depth,
source->nChannels);
cvCopy(source,pDest);
cvResetImageROI(pDest);
2.2.3 实际效果
从分割结果看,该分割算法能把所有的单个图片联通区域分割出来,但是分割出的区域存在很多干扰区域,增加了实际区域提取的复杂度(见图2)。
<E:\方正创艺5.1\Fit201501\图\ww图2.tif>
图2 连通区域分割
下面将在此基础上进行改进。
2.3 改进后的算法
增加连通区域的有效性判断及过滤;
checkSplitRect(Rect rect,int height,int width)
同时对一些单字符被分割成多个字符的区域按照一定的算法及规则进行有效组合和合并;
vector<Rect> MergeImage(vector<Rect> validRect)
最后形成的分割效果如图3所示,将所有字符正确的分割出来,去除了干扰,达到了理想的效果。
<E:\方正创艺5.1\Fit201501\图\ww图3.tif>
图3 改进后的分割效果
3 实验结果
为了验证本方案的可行性和可操作性,本文使用10000张测试图像作为实验测试库,对此方案进行测试。测试结果:正确分割达到99%以上。如图4,改进后的分割正确率比改进前的分割正确率提高了将近20倍。
<E:\方正创艺5.1\Fit201501\图\ww图4.tif>
图4 分割对比
4 结束语
图像分割没有通用的理论,要根据具体情况采取有效的方法。利用已经研究出的多种图像分割方法,将多种方法综合运用,发挥各自的优势进行图像分割将成为这一领域的发展趋势。同时,由于现在所处理的图像的复杂度和固有的模糊性,传统的单一的处理方法已不能适用需要,与新理论、新工具和新技术结合起来才能有所突破和创新。
本文在原有分割技术的基础上,结合实际的使用情况,进行了算法思想的改进和创新,最终达到了理想的分割效果,在一定程度上具有良好的研究和实用价值。
参考文献:
[1] R.M.Haralick,L.G.Shaprio, "Image segmentation tech2 niques",
Computer Vision, Graphics, and Image Processing,1985.29:100-132
[2] 罗希平等.图像分割方法综述[J].模式识别与人工智能,1999.12(3):
300-312
[3] 吴一全,朱兆达.图像处理中阈值选取方法30年(1962-1992)的进
篇13
在获取信息时,通常都要识别某领域内的图像。精确处理图像,关系到设定决策的精确性。最近几年,图像处理日益融汇于全方位的生产及日常生活。判断并且识别图像信息,才能用来处理某一问题。航拍影像照片、层析用到的射线图、电视的图像等,这些都源自计算机处理得出的图像。图像是否精确,密切关系到图像本身的分辨率是否优良。由此可见,若要在短时段内获取完整且精准的图像信息,就要提升分辨率,快速识别并且获取可信的图像信息。
1 图像处理的根本技术
计算机协助的图像处理采纳了如下技术思路:针对于选定的图像,借助微机用来处理并且解析。经过全方位处理,获得符合需求的新图像。计算机辅助下,图像处理即为新式的影像处理,采纳了新阶段的计算机手段。通常状态下,处理各类的图像都配备了扫描仪、数字性摄像机。具体在采样后,可得二维性的数字数组并且构建像素。采样可得二维的整数数组,由此产生灰度值[1]。从处理流程来看,图像处理可分成如下:对图像的压缩、复原以及强化、匹配各类的图像、识别并描述图像。
在这之中,压缩图像是必要步骤。数字化处理后,经常获得较大量的图幅数据。典型状态下,数字图像都含有多个像素。某些图像呈现为动态性,同时也附带了更多量的像素数据。由此可见,妥善存储并且压缩图像是尤为必要的。从算法来看,压缩图像包含了近似算法以及不失真的方式。常用的流程为:在时间空间上,针对于邻近像素值予以编码,而后求出差值。例如压缩可得精确的游程编码,即为典型实例。与之相比,压缩图像配备的近似算法可借助交换图像,经过余弦变换可得图像。这种典型即为MPEG类的新式处理,此外还可选取傅里叶的快速变换。对于动静态这样两类的图像,都是很适用的。
选出了待处理的某一图像,还需再次去复原或增强。这样做,是为从根本上改进图片,提升影像的质量。复原及增强可选的方式包含了去模糊性、去除噪声、强化对比度、减低几何性的畸变。复原图像则先要设定噪声模型,估测并推断得出原先的图像。增强图像的方式为空间域或频率域,把图像化作可识别的信号,通常为二维信号。在这种基础上,再去强化信号。去除图像噪声,可选傅里叶变换的途径,但它仅适合于频率偏低的信号。高通滤波用来强化频率较高的图像信号,影像将更为清晰。典型性算法为:算出局部影像的平均值、计算出空间域、选取中值滤波的方式。经过这些处理,都可缩减直至除掉噪声。
2 图像处理的必要性
在各个领域中,都不可缺失信息。图像信息相比来看更具备直观性,更易识别判断。认知世界的过程中,就要借助直观性的图像信息用来获得判断,收获信息来源。然而,原始影像经常是模糊性的,很难借以估测某些必要信息。唯有经过处理,才能显示出隐含的某些信息,图像更加清晰。在现今阶段内,计算机辅助下的多样技术都获得了进步,尤其图像处理。在微机协助下,人们即可更便捷且精确地处理影像,进而获取更精准的清晰图像[2]。这样做,便于给出决策,或者获取信息。
日常生产中、科研等领域中,都需接触各类的影像。新阶段内,图像拓展了含义,包含遥感影像、医学拍摄的光片、清晰度更高的照片等。认知客观世界,不可缺失这些图片。计算机拥有更大容量及更高的实效性,也提升了原先的处理速度。在这种状态下,可处理的图像日益变得多样化。与此同时,摄像装置也拥有了高精度,趋向于小型化,这就在根本上改进了画面的总体质量。由此可见,现今的图像处理可以凭借于小型微机,提升处理的实效。
信息化时代内,图像处理日益融汇于多行业。例如医学影像,可用来分辨出机体内的断层;技术性的图像,可用来调控并且监管生产。面对于复杂的图像,还需快速判断可提取的信息,作为处理根据。生成数字图像,也可借助计算机予以实现。最近几年,计算机配备的软硬件都正在改进,推进了全方位的图像处理手段更新。在广阔领域内,都用到新阶段的图像处理。计算机辅助的新式图像处理拥有了小型化,也加入了更优的实时性及远程性。
3 设置图像分辨率
从根本上看,图像整合了多层次的信息,表现出全面性。在各类介质上,还可再现原先的信息。作为集合体,图像可用来集成并处理信息。对此,就有必要设置并匹配分辨率。具体而言,设置分辨率要注重如下事项:
3.1 选取分辨率
选定分辨率过程中,先要确定最适当的影像扫描率。初期在构建图像时,若设定了较低分辨率,那么扫描得出的影像也并不很精确。从这种角度看,单独提升像素并非必然可获得更为清晰的影像。导入扫描的过程中,针对特定图像还需设定匹配性的分辨率,这种分辨率被看成扫描阶段内的分辨率。若分辨率设置得很高,扫描可得优质影像。然而,这种设置也并非完美,也是有局限的。这主要是由于,扫描仪本身就表现为局限性,制约了分辨率。此外,要设置扫描的分辨率,还需兼顾给出来的处理目的[3]。
3.2 具体设置方式
设置分辨率时,要把它限定于最佳范围内,不可超越范围。条件准许时,若有必要放大固有影像,则还需筛选更大分辨率。然而各步骤中,都需控制于最吻合的分辨率之内。在软件帮助下,可再次予以放大。从现状来看,处理图像可借助多款的软件。选取了最佳软件,对应着的处理实效也会变得更优。同时,插值算法也密切关系到图像处理。插值算法可用来具体放大图像,进而判断出某一最相符的扫描分辨程度。经过扫描之后,要依托某种媒介用来输出,还要视情况予以放大原图。
在某些情况下,屏幕可用来显示出扫描后的影像,可至网页。具体显示时,应能维持恒定的图像规格尺寸。通常来看,可设置于70dpi的分辨率。若有必要放大,那么借助如下公式用来确定分辨率:扫描时的分辨率=72*影像的各边长/最初的边长。
扫描之后,需要输出并予以打印,这样才可获得易辨别的影像。具体打印步骤中,要维持最初的边长及尺寸。在这种基础上,最便捷的方式即为筛选分辨率,输出打印线的总数。如果需要打印,还需依照如下思路来设定分辨率:输出线频率*图像处理后的各边长/最初图像边长。
3.3 匹配不同的分辨率
打印的过程中,分辨率应当是可以匹配的,这种匹配是指图像本身及打印机二者的分辨率。打印机产生了某种输出,这种状态下即可算出最精准的分辨率,然后用来计算。输出打印之前,需要妥善匹配合适的分辨率。需要注意的是:打印设备及图像本身并不需要设定完全同样的分辨率,只要匹配即可。经过详尽的匹配,才会确保输出得到的图像是优质的。某些作品设定为较高分辨率,针对于这类作品先要妥善予以保存。预留必备的备份,依照打印机来选取分辨率。
图像分辨率可设置为双倍的打印机线频率。在这时,可自主予以定义。打印的步骤中,需要舍掉冗余性的某些图像。这是因为,打印出来的影像并不需要添加繁杂的细节,这些细节也会拖延更长的打印时间。打印机设有自身的分辨率,单位为各英寸内的图像点数。具体打印过程中,若没能明确某一个打印机的精确线频率,那么还可大体予以匹配。同时,应当优选适合的纸张用来打印。因为在不同材质上,打印得出的分辨率其实并不相等。
4 处理中的超分辨率
从总体来看,依照输出及输入的不同算法,可设置组合性的不同超分辨率。重构超分辨率的微机图像,借助于信号处理来转变原先较低的分辨率,变为高分辨率。这种技术目前正被广泛选用,用于打印图像、构建视频监控、解析刑侦案件、构建卫星成像或医学影像等。超分辨率关系着各类处理,例如根本性的图像处理、微机辅助的视觉性处理[4]。重构超分辨率时,也需要先期压缩图像、提取图像的特性、评价图像质量。需要提取独特的图像特征,优化得到最佳的某类算法。
超分辨率的构建中,重要步骤应为处理频域。唯有经过频域处理,才能构建精准的超分辨率。在频域范围内,可以用来卷积图像、旋转或平移图像。经过全面处理,即可转变成更易辨认的计算方式。分辨率领域内,频域方式拥有更高层次的直观优势。对于此,还可选取傅里叶变换。假定某一生成模型,经过连续性的变换即可构建线性的频域关系。
此外,超分辨率还会用到插值方法,这种方式针对于不均匀的图像。在重构超分辨率时,插值方式是更为简易并且直观的。对于非均匀性的处理图像,插值方法包含了如下流程:对于输入视频,配准为给出来的平面图像。经过转换之后,再设置对应性的图像约束。从本质来看,这种重构图像即为整合性的插值,可用于各阶段内的图像生成或处理。
5 结语
图像处理源自新阶段内的微机技术,经过处理以后,应能获取最佳的图像效果。通常来看,这类处理技术要符合设定的分辨率,易于辨别且可提供决策的参照。图像处理包含了多样的复杂要素,要全方位衡量并且判断,这种基础上得出精准的结论。从目前状态看,图像处理的相关性技术仍没能达到完善,有待持久的改进。未来的实践中,还需继续摸索,归纳图像处理的经验,服务于各领域内的计算机处理。
参考文献:
[1] 苏衡,周杰,张志浩.超分辨率图像重建方法综述[J].自动化学报,2013(08):1202-1213.