引论:我们为您整理了13篇数字图像处理论文范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。
篇1
2013年以信息与计算科学专业11-1班为对照班,2014年以信息与计算科学专业12-1班为实验班,2个班级学生的学时数一样,学生起步几乎也是一样,讲授的数字图像处理课程主要内容相同.在11-1班中采用的是传统教学模式,讲授理论上的图像处理原理和方法;在12-1班中采用项目教学法进行教学.为了验证在数字图像处理课程中应用项目教学法的效果,对2个班级分别进行了数字图像处理理论知识测试和编写一个图像边缘提取的程序.理论知识测试结果见表1(满分100分).编程题是通过在线考试系统完成的,由计算机给出的成绩,编程题测试结果见表2(满分20分).
篇2
关键词 :数字图像处理;教学优化改革;师资力量;课程标准
基金项目:全军学位与研究生教育研讨会研究课题“军队院校研究生教育中的导师与研究生关系研究”(YJZX14C14)。
第一作者简介:孔韦韦,男,讲师,研究方向为图像处理,kwwking@163.com。
0 引 言
数字图像处理[1-2]是信息处理领域的重要分支,通过该课程我们可以完成图像的几何变换、算术处理、图像增强、图像复原、图像重建、图像编码、模式识别、图像理解等多个方面的工作。目前,随着计算机软硬件处理能力的不断提升,数字图像处理技术已被广泛应用于医学检测、反恐处突、弹道导弹精确制导等多个军(民)用领域。由于该门课程的特殊地位和广泛应用,国内外几乎所有信息类专业都开设了该课程,许多专家、学者也针对课程的教学方式提出了自己的观点[3-8]。
军队院校作为高等院校中的一类特殊群体,无论在课程设置还是人才培养需求上均与地方高等院校有很大的不同。军队院校自身的特殊属性要求培养出的人才不仅要有扎实的理论基础和科研能力,还能运用这些知识对作战以及日常训练中出现的问题加以解决,因此,军队院校对人才的理论与实践结合能力提出了更高也更为严格的要求。
武警部队负责维护国家安全和社会稳定,有效打击国内外各种恐怖势力,保障人民安居乐业。当前,世界各国都将“反恐”作为维护国家稳定和保卫人民生命财产安全的一项重要任务。反恐图像目标的识别和监视能力更体现了一个国家的反恐技术力量和能力水平,其关键在于反恐图像目标的识别。因此,有效地将数字图像处理技术应用于反恐处突领域,不仅有助于提升针对恐怖势力的打击力度,还可以有效减少伤亡,最大限度地保障国家和人民的生命财产安全。
1 数字图像处理课程的特点
数字图像处理课程主要有以下几个特点:①理论基础要求高,涉及高等数学、信号与信息系统、信息论、计算机编码等多个领域的知识;②数字图像处理课程覆盖的内容广泛,知识点繁杂零碎;③新兴理论的不断出现要求广大学者能够敏锐把握数字图像处理技术的发展前沿;④数字图像处理技术的应用领域不断拓展,处理方法也更为复杂。
2 军队院校数字图像处理课程教学中存在的问题
2.1 课程设置不灵活
相比地方高等院校,军队院校的课程设置自由度十分受限,具体体现为课程的教学内容、学时安排、课堂组织形式甚至是开课时间均有严格的规定和限制,不能根据学生理论基础和学习能力的实际情况做自适应的调整。
尽管研究生有自己的导师和研究方向,且很多研究生日后学位论文的研究方向可能与数字图像处理领域并无关联,然而,由于许多信息类专业院校的研究生培养方案均严格限定该课程为学位必修课,导致一些研究生为了学分和学位只得选择一门与自己研究领域完全无关的课程,无形中造成了教学资源的浪费。
2.2 课时少内容多
数字图像处理课程是国内外几乎所有信息类专业的必修课。地方高等院校通常会开设50个学时,而军队院校大多只开设40学时,有的学校甚至只将其作为学位选修课开设20学时。众所周知,该课程涉及的教学内容非常繁杂且对相关课程的理论基础提出了较高要求,这类课程即使安排50学时也很难将重点内容讲授完毕,军队院校课程课时不足无疑对该课程的教学质量造成重大影响。
2.3 教学形式单一
军队院校的特殊属性在一定程度上约束了课堂多种教学形式的存在与发展,传统的教师主体式教学法是主流。这种过于单一和机械的教学形式将对研究生的学习积极性造成不利影响。另外,军队中上下等级关系往往扼杀了研究生质疑教师的勇气和可能,使研究生不敢对教师的见解有所质疑,不敢擅自踏入教师未首肯的领域中积极主动地发现问题、分析问题和解决问题,导致研究生的学习完全处于被动境地。
3 教学优化改革
3.1 师资力量建设
数字图像处理课程专业性强、理论难度大,涉及的基础学科门类较多,因此,在条件允许的情况下应尽可能安排科研方向或理论研究方向属于图像处理领域的教师担任任课老师。一方面,长期从事该领域的教师对课程的基本内容和理论了如指掌,基本功非常扎实,授课更为流畅、自然;另一方面,教材中介绍的只是图像处理领域的基础理论和经典模型,长期从事该领域研究的老师在研究过程中往往对课程中的概念及理论模型有更深刻的理解,在授课过程中必然会附带介绍本人在该领域内的研究现状和最新进展,有利于开阔研究生视野,激发学习兴趣,提高授课质量。
3.2 课程标准的制定
结合军队院校课时不足的教学实际以及人才培养类型的定位需求,我们完全有必要重新制定数字图像处理课程的教学标准,在保证理论系统性完整的基础上,侧重实践能力以及解决实际问题能力的培养和提升。具体措施如下:①教学对象精确定位,扭转以往研究生课程频频出现的“被选课”现象,切实保障“选修权”,允许研究生按照自己学位论文的研究需求选课;②由于学时有限,在制定课程标准时必须全面分析和研究教学内容,梳理与课程内容相关的知识目标、技能目标和素质目标,适当地删减一些非重点内容,重新划分各章节的学时;③数字图像处理虽然是一门理论性很强的课程,但学习的最终目的还是应用,因此,在制定课程标准时必须为研究生学员留有一定的实践操作以及课堂研讨课时;④要反映部队特色,在授课过程中重点介绍能够直接应用于部队实际的模型和方法,譬如模式识别、图像理解版块,并要求研究生动手实践;⑤紧跟发展前沿,保持知识的先进性,充分利用网络资源,以完善的学习资料、丰富的课程资源、真实的实践环境作为课程的基础和支撑。
3.3 教学方法与设计
结合课程标准,我们拟将整个教学过程分解为4个阶段:①基本理论讲授;②专题讨论;③专题讲座;④实践操作。
3.3.1 基本理论讲授
教师对教学内容中的基本理论加以讲解,旨在为研究生扫清基本理论障碍。该部分的讲解并非只是对课本内容的简单复制和重申,而是在介绍基本理论的基础上,对基本概念中涉及的各层次知识点和潜在疑问加以梳理和阐释,为下一阶段的专题讨论做铺垫。该阶段以教师讲授为主体,采取案例式教学和启发式教学相结合的授课方式。
3.3.2 专题讨论
所谓专题讨论,就是基于教师先前讲授的某一个或某一类基本理论,探讨具体应用效果以及可能影响最终图像处理效果的若干因素。这一环节将彻底打破经典教学模式中的“教师主体”模式,转变为“教师确定讨论范围—研究生为讨论主体—教师最后总结”的模式。在整个过程中,教师和研究生的角色完全转换,由研究生基于自身掌握的知识充分发挥自己的想象,针对若干问题展开探讨或者辩论。譬如,教师在探讨前先介绍图像去噪理论的相关知识,包括噪声产生的原理、噪声的种类、噪声在图像中的表现、几类经典图像去噪方法等,上述部分内容讲授完毕后确定3个问题,即均值去噪和中值去噪方法的原理有何不同?各自的优缺点何在?各自在去噪过程中可能影响最终效果的因素有哪些?下一次课教师可安排专题讨论,并将研究生在讨论中的表现作为课程成绩的一项重要依据。
在该门课程课代表的组织下,研究生被分成若干小组,大家利用课余时间分别对两种去噪方法展开了深入研究,并通过Matlab软件仿真验证,记录诸如峰值信噪比PSNR等相关指标值,初步得出可能会影响最终去噪效果的若干因素;几位同学针对一些不太一致的观点展开激烈的讨论;最后,由教师进行内容总结和答疑解惑,一些研究生还对教师的某些结论提出质疑。
专题讨论完毕后,教师和研究生普遍感觉以往枯燥又不合时宜的教学方法得到了彻底改变,研究生内心的求知热情得到了极大的激发。此外,整个专题讨论过程也锻炼了他们的逻辑思维,为了说服“对手”,他们必须要找到支撑自己观点的科学依据,包括权威论坛上的答疑解惑以及仿真软件仿真出来的实际结果等。有了这些证据后,他们还要对数据进行分析研究、组织语言、理清思路,而在以往的教学模式下,研究生并不会主动花费时间查找资料,教师由于课时的关系也不可能对每一种理论都进行仿真演示。
3.3.3 专题讲座
担任数字图像处理课程任务的教师必须从事图像处理领域研究,因此,在教学过程中,适时安排1~2次专题讲座,由任课教师将自己在本领域的研究成果或是研究体会以讲座的形式向研究生进行报告。在讲座过程中,教师将从一个较高的层次,把一些新的内容介绍给研究生,同研究生一起分享图像处理领域最新的发展动态和研究成果,开拓研究生的视野,为研究生动态更新最新的前沿知识。另一方面,由于课程标准制定过程中教学对象已实现了精确定位,凡是选修数字图像处理课程的研究生日后均要从事该领域的研究,因此专题讲座的开展也在一定程度上为研究生日后的学位论文撰写提供灵感和研究方向。显然,专题讲座是课程教学强大而又有益的补充。
3.3.4 实践操作
由教师从教学内容中选取若干重难点且与部队作战(训练)密切关联的内容,交由研究生自行仿真实现,记录主客观评价指标数值,对仿真结果进行比较与分析,并得出结论;对仿真结果中的不足展开讨论,给出可能的解决方案。显然,该阶段侧重课程标准中“反映部队特色”的宗旨,要求学员学以致用,切实将书本中的理论知识运用到部队实际中,为部队服务,提高作战能力,体现军队院校“向部队靠拢,向实战靠拢”的办学宗旨。
在实际操作中,为了贴合武警部队反恐处突场景的作战实际,教师为学生布置了模式识别版块中的图像融合仿真实验,给出了国际TNO组织提供的联合国营地源图像,源图像取自同一场景,一幅由灰度可见光图像传感器获得,另一幅由红外图像传感器获得。该实践场景十分类似于武警部队对潜藏在树林中的恐怖分子进行围捕的场景,要求研究生对现行资料中融合效果较好的6种融合方法进行仿真,记录仿真结果并加以分析讨论。
通过这一阶段的训练,研究生将书本中的理论知识与实际应用进行了有机结合,取得了良好的效果,并为日后将相应方法应用于部队作战(训练)提供了理论基础和支持。
3.4 考核方法
课程考核采取百分制,并综合考虑研究生在笔试、专题讨论、实践操作3个环节中的表现,3者的比例为0.30:0.35:0.35。在考核中,教师更看重研究生在该门课程中针对实际问题的分析能力和实践动手能力,以期学生真正理解和消化书本中的理论知识。笔试采取开卷方式进行,侧重考核研究生对该门课程中的基本理论、概念、公式的掌握情况,因此,同以往的纯闭卷考试相比,该考核方法灵活度更高,考核效果也更理想。在最终考核中,由于采取了更为有效的考核方式,学生只要认真参与教学活动,必然可以顺利通过考试并拿到高分。如今,两年的教学改革已经使该课程在研究生中小有名气,从往日学员们的“黑名单”课程转而成为“热销品牌”。
4 结 语
两年的实践结果表明,相比传统的授课方式,该改革方案更符合高等院校的教学规律和实际情况,尤其是将部队的实战需求充分融入课程标准的制定过程,更加贴近了当前军队院校的人才培养需求,充分体现了军队院校“向部队靠拢,向实战靠拢”的办学宗旨。
参考文献:
[1] 冈萨雷斯. 数字图像处理[M]. 北京: 电子工业出版社, 2014.
[2] 贾永红. 数字图像处理[M]. 武汉: 武汉大学出版社, 2010.
[3] 杨淑莹, 张桦.“数字图像处理”理论与实践相结合教学模式[J]. 计算机教育, 2009(24): 84-86.
[4] 周海芳.“数字图像处理”课程研讨式教学[J]. 计算机教育, 2010(24): 93-97.
[5] 周耿烈, 鲁逢兰. 图像处理技术精品课程建设[J]. 计算机教育, 2010(18): 101-104.
[6] 何楚, 冯倩, 杨芳, 等. 数字图像处理课程实验教学过程设计[J]. 计算机教育, 2011(18): 74-77.
篇3
1 前言
数字图像处理技术的应用非常广泛,已经渗透到计算机、通信、交通、物理、医学、化学、生物学、军事、经济等各个领域,与人们的生活密切相关。《数字图像处理》是信息技术领域中发展较快的一个热门领域,是模式识别、计算机视觉、多媒体技术、数据挖掘等学科的基础,也是一门涉及多领域的交叉学科。
该课程的理论性和实践性都很强,要求学生在掌握图像处理的基本概念、基础理论、典型算法的基础上,掌握一定的编程实践能力,能够利用计算机编程实现数字图像的各种处理,如图像变换、图像增强、图像恢复、图像重建、图像分割、图像编码和图像识别等,在学习图像专业知识的过程中增强学生的创新意识,培养学生独立获取知识和综合运用所学知识分析和解决实际问题的能力,提高学生的实际动手能力,为其今后深入地进行科学研究和独立工作奠定良好的基础。
2 创新教学理念
在《数字图像处理》课程的教学中,努力贯彻素质教育的先进理念,注重教与学的有机结合,坚持以学生为主体,教师为主导,最大限度地发挥学生的主观能动性,将培养学生的主动思维,鼓励学生的创新意识作为教学的重要目标之一。
对于教学内容的设计,以图像处理算法的理论作为授课的重点,以算法的产生、应用、改进为主线,突出知识的内在联系,揭示数字图像处理发展的内在规律(要求学生重点理解)。
掌握数字图像的基本概念和基本算法,关注图像应用的前沿动态,培养学生的创新思维能力,并根据课程需要,适当将数字图像处理领域中最新的技术手段,研究进展以及发展趋势纳入教学,并鼓励学生对新知识、新领域进行积极地探索。
在教学过程中,努力将复杂抽象的理论融入到形象直观的应用实例当中,将算法实现过程中的重难点问题分解细化为可展现的图像处理效果,在理论中渗透实践,在实践中穿插理论,注重理论联系实际,培养学生的工程实践能力,真正使学生乐学、易学并会学。
3 改革教学内容
数字图像处理技术在科学研究、工农业生产、军事技术和医疗卫生等许多领域中发挥着越来越重要的作用。图像技术的快速发展决定了《数字图像处理》课程的教学内容也需要不断更新,教材原则上选用专业内容全面新颖的教材,即图像专业基础知识相对稳定,并能够紧跟数字图像处理技术发展趋势。对于辅教材,可以根据图像课程的系统性和实用性,并考虑到扩充学生的视野,可以选一些国际上经典书籍如外文经典专著。目前我们以2012年清华大学出版社出版的,章毓晋编写的《图像工程(上册)――图像处理(第三版)》教材为主线,以美国Rafael C.Gonzalez 等编著的Digital Image Processing,阮秋琦编著的《数字图像处理学》等教材和中外科技期刊发表的最新图像技术为参考资料,并适当补充本领域中的一些新技术、新方法及新成果。
对图像处理教材内容进行整合,课内图像处理基础知识分为九大模块:图像与视觉基础、图像运算与变换、图像增强、图像恢复、图像重建、图像编码、图像分割、图像目标表达与描述、图像识别等内容。
在授课过程中,一般知识点进行自学,系统讲解重点难点内容,如直方图均衡等,而对于教材中未写进或无系统介绍的前沿性、创新性或跨学科的内容,则渗透到各个章节中。例如,将水果识别系统、车牌图像的自动识别、基于内容的图像检索等新技术渗透到图像增强、图像分割、图像目标表达与描述和图像识别等各个章节中,授课内容完成,那么自动识别系统模型建立,学生就完成了水果、车牌等图像的自动识别。通过这种方法强调基础,跟踪前沿,将基础理论与实践有机地结合起来,使学生不仅能够学到课程的基础知识,了解科学前沿的最新成果,加强学生的实践动手能力,而且与时俱进,增强了学生的好奇心,促进学生创新能力的培养。
4 改进教学方法
在数字图像处理教学中,综合运用课堂讲授法、研究法、讨论法和实验法等教学方法,发挥各种教学方法的优势,引导学生积极参与教学。
对于一般的重点难点内容,例如,图像增强中的直方图增强等模块,同时以课堂讲授和实验法为主,在讲解图像增强理论的同时进行图像直方图增强实验,在图像增强原理讲完之后直接出现直方图增强的前后对比图,可以激发学生的兴趣和动手能力。
对于图像边缘检测等一些难度相对较小的内容,首先以讲授法系统地讲解其中一种边缘检测算法,其他与之原理相似的算法则运用讨论法,以学生讨论、交流为主,教师引导、点评为辅进行。
对于课堂难度较大的内容如图像恢复与重建,则采取研究法为主,其他方法为辅。促使学生主动思维,成为真正的学习主体,教师根据学生反馈的信息及时把握学生思维过程,成为真正的主导。
另外,对于图像某一知识模块的引入,可以适当设置一些悬念或疑问,再引出讲授的主要内容,即将教学过程设计成一个“产生疑问―寻求解决方法―解决疑问―再产生疑问―再寻求解决方法一再解决疑问……”的过程。这样不仅有利于增强授课内容的逻辑性,还有利于启发学生的思维,激发学生的兴趣及创新能力。
5 丰富教学手段
鉴于数字图像理论知识比较丰富,实践性比较强,应用领域比较广的特点,以及现有教学设备、教学网络环境的改善,《数字图像处理》课程采用板书、多媒体课件、辅助教学软件以及教学网络平台等多元化的教学手段。充分活跃课堂气氛,提高教学效果,促进教学改革,提高学生的学习兴趣及实践动手能力,增强学生的信息素养,获得了良好的教学效果。
对于数字图像处理中典型算法的原理与推导等难度较大的内容,以板书为主,通过对公式的推理计算,体现出知识的逻辑性和严谨性。同时适当辅以多媒体课件对图像处理的结果进行演示,以加速学生对授课内容的理解,增强了学习的直观性、生动性和趣味性。
针对本课程的特点,开发了辅助教学软件,利用该软件在课堂教学中将图像处理算法的实际效果进行随堂演示,从而将枯燥的理论推导转化为立竿见影的实际操作。让学生充分感受到数字图像处理技术的巨大魅力,从而降低了理论知识学习的难度,增加了课堂的信息量、激发了学生的学习兴趣,实现了化静态为动态,化抽象为直观,化复杂为简洁,使课堂教学的效率大大提高。此外,又锻炼了学生的研究性学习能力,培养了学生的创造性思维。
根据课程教学标准,进一步改革教学实践,安排了实验教学,并将实验内容划分为验证性实验和设计型实验。验证型实验的设计,要求学生掌握数字图像处理、基本操作处理和简单的典型算法编程,从而实现对课堂上理论知识的学习巩固,增强了学生的编程能力和基本的项目开发能力。设计型实验需要学生对源代码进行分析研究、修改或补充,动手设计一些综合性或创新性的算法,分析实验结果,写出实验报告或论文。既培养了学生发现问题,分析问题和解决问题的能力,又提高了学生的动手能力和创新能力。
利用大学提供的教学网络平台,把图像处理课程的教学标准、授课教案、教学课件、习题、实验指导以及相关参考资料都上传到此教学网络平台。同时引导学生在网络上积极讨论关于图像处理方面的一些最新研究等话题,激发学生讨论及思考。另外,学生对于未消化的难点,也可以在网络平台上提出,教师及时通过教学平台进行回复,实现课后数字图像处理教学的互动,从而作为课堂学习的补充。教学网络平台实现了教学资源的共享,课后教学的互动,丰富了教学手段,为开展多种形式的教学奠定基础。
6 改革考核方法
课程考核对于加强学生对学习内容的掌握、实验技能的提高、创新能力的培养具有很大的促进作用。然而,传统的闭卷考试,主要考核学生对课堂教学内容的理解和掌握,容易使得学生将注意力放在背记考点及研究考试技巧上。《数字图像处理》课程是一门实践性很强的课程,仅采用这种评价方式将难以调动学生实践学习的积极性,达不到良好的效果。
在考核方法的改革上,对《数字图像处理》课程采用了综合性的考核方法。期末考试采用笔试开卷方式,主要强调学生对数字图像处理技术基础理论的宏观掌握。在考试题目设计上,重点强调学生知道如何去寻找解决问题的方案,考核学生发现问题,分析问题和解决问题的能力;同时增强实验成绩的比重,根据学生对实验内容的完成情况,以及创造性解决图像处理问题的能力,对实验成绩进行评分。另外,还将平时的听讲,回答问题,作业的情况列入平时成绩。因此《数字图像处理》课程最终的考核成绩包括三个部分:期末考试成绩(占50%),实验成绩(占30%)和平时成绩(占20%)。
通过课程考核方法的改革,不仅有效地检验了学生对《数字图像处理》课程的综合掌握程度,而且还能激发学生学习的积极主动性,提高了实践创新能力。
7 结语
随着信息技术不断发展和完善,数字图像处理技术也在不断发展,并且越来越多地应用于各个领域,相应地,数字图像处理课程的教学改革和实践也应与时俱进,结合国内外科研和教学成果,不断吸收新知识,丰富教学内容;根据教学内容灵活运用各种教学方法,使学生在掌握数字图像处理基本理论和方法的基础上,培养学生的实践动手能力,创新意识与综合设计能力,使学生的信息综合设计能力和科学研究能力有明显地提高。激发学生主动学习的兴趣,提高学生进行研究性学习的能力,同时进一步提高教学质量和教学水平,真正培养出具有开拓精神和创新意识的现代化新人。
参考文献:
[1]章毓晋.图像工程(上册)――图像处理(第三版)[M].北京:清华大学出版社,2012.
[2]冈萨雷斯.数字图像处理(第三版)[M].北京:电子工业出版社,2010.
篇4
数字图像处理课程属于图形图像应用领域的重要基础理论课,长久以来课程内容主要介绍基本的图像处理算法以及少部分图像分割和图像识别,对于图像处理在实际生活中所涉及的很多前沿科研领域介绍较少,因此很多研究生无法将课堂讲授的理论知识与其后续从事的研究课题有效地关联起来,感到课堂中讲授的很多内容看起来毫无用处,从而丧失了学习的积极性。
很多教师认为把图像处理中的算法研究透彻、把基础打好对研究生非常重要,但是这忽视了研究生是有着极强的科研探索精神和丰富想象力的年轻一代。如果将一些在生活中涉及图像处理的問题交给他们进行探索,将会激起他们浓厚的学习精神和创造力,这种没有标准答案的应用题目可以进一步锻炼他们的思考能力。
为此,在课程的教学方法和实验内容设计上,我们重点培养学生以下两方面能力。
(1)应用型研究能力,包括发现問题、分析問题和解决問题的能力;
(2)应用型技术能力,包括编程设计能力和项目合作能力。
下面笔者分别从教学大纲、教学方法设计和实验内容设计3个方面进行介绍。
1.数字图像处理课程教学大纲
我们在设定教学大纲时,重点参考了多本数字图像处理方面的经典教材,如杨枝灵和冈萨雷斯编写的教材。结合之前的教学经验,同时注意与本科生课程相区别,制订了两个原则:加强中高级图像处理算法的介绍;增加利用图像处理算法的应用案例的介绍。中高级图像处理算法主要指图像分割算法、图像特征提取方法和运动检测方法。同时我们还在课堂上给出一些应用案例,进一步帮助学生将理论知识与实践相结合。
数字图像处理课程目前作为北京林业大学研究生的专业必修课,总学时为32,其中课堂讲授24学时,实验8学时。相对于其他学校,这门课程的总学时和实验学时数不多,我们设计的教学内容如表1所示。
2.数字图像处理教学方法设计
针对培养学生应用型研究能力的目标,我们在教学方法设计上本着激发学生的学习兴趣,开阔学生眼界,给学生提供更自由的思考空间的原则,通过下面两个措施来实现我们的目标。
2.1精心选择案例
选择的案例要贴近实际生活,并与课堂上讲授的方法紧密衔接。例如,在讲解图像增强和复原这两章之后,我们引入在实际生活中常见的“图像去雾”問题,通过如下方法,培养学生研究能力。
(1)要求学生先尝试用学过的算法来解决这个問题,并在课堂进行算法讨论,给出算法结果。
(2)要求学生针对具体問题,查阅文献资料,了解别人的解决方法。通过查阅国内外的文献资料,同学们知道了如何根据关键词查询科研论文,了解哪些电子数据库中有与专业相关资料,知道了文献的级别有SCI、EI、核心期刊、一般期刊等。
(3)学生将查到的算法进行分类和总结,撰写文献综述。
(4)每位学生都需要编程实现“图像去雾”算法,这个算法是结合自己的思考、实践以及查阅文献的结果。
通过自己动手,同学们发现如果图像的清晰度不好,有噪声,或者没有归一化,结果就完全不同。通过自己动手验证,同学们会发现图像处理领域的一个最为重要的特点——任何算法主要都是针对一类图像或是针对一类問题而设计的,因此在算法的适应性上需要有所考虑。
2.2全面介绍图像处理的各个应用领域
老师在课堂上介绍几个图像处理涉及的较为重要的应用方向(如视频监控、图像检索、人脸识别、运动检测、车牌检测等)后,将同学们进行分组,每组负责查找一个应用方向的相关资料,讨论和汇报自学的结果。汇报内容主要包括:①应用方向的介绍;②涉及的主要問题;③目前的解决方法及应用成果。
通过查找文献,同学们不仅对课上学习过的经典算法有进一步了解,同时还接触到很多新算法。通过听取各组汇报,同学们在较短的时间里,了解了图像处理涉及的多个主要的应用领域。针对每个应用研究领域,老师引导学生分析该领域的难点和重点,提出問题,再让学生思考解决方案,没有标准答案,只希望能够锻炼学生的思考能力。以“人脸识别”为例,有很多经典的或较新颖的算法,老师会结合应用领域对其中常用的或比较重要的算法,如PCA方法和Adaboost算法,进行详细讲解,使学生全面了解图像处理算法的应用领域。
3.数字图像处理实验内容设计
针对培养学生的应用技术能力的目标,同时考虑到本课程实验学时数较少,我们设计了两个实验——基础性实验和综合性实验。
3.1基础性实验
目前很多经典的图像处理算法是用vC++程序实现的,我们要求大家学会读程序,能够看懂已有的算法实现程序,并在此基础上能开发新的功能。
实验一:实现对多种图像格式的支持(2学时)
实验内容:采用VC++编码实现,基于CDib类,添加支持打开,并保存多种图像格式的功能。包括JPEG和GIF。
实验要求:利用学习的图像压缩的知识,利用现有的编码解码库实现对IPEG和GIF图像的打开和保存。
实验目的:了解多种图像格式,编写针对多种图像格式的读写程序,能够进一步理解针对图像的编程的特点,同时也进一步了解开发图像应用程序的适应性問题。
老师在课程初期会向大家介绍图像处理的一个公开库——CDib类。该类很好地封装了图像的数据结构,涉及很多图像的基本操作。我们知道现实生活中的图像常常都是压缩格式的,如BMP、JPEG、PNG、GIF等。因此在讲完图像的压缩格式后,对照讲过的BMP图像结构,老师要求学生为CDib类添加能够支持多种图像格式的功能。以GIF图像为例,它不同于如JPEG、PNG等格式,GIF采用的是LZW压缩算法,使用的是无损压缩技术。GIF图像的特点是可以一次压缩多幅图像,图像颜色表控制为256色,使用渐显方式。
3.2综合性实验
针对综合性实验,我们会拟定多个题目让学生选择,如树叶提取、花朵提取、车牌识别等。
实验二:数字号码图像的识别(6学时)
实验内容:采用VC++编码实现,基于CDib类,针对数字号码图像,识别出数字,给出文本显示结果。
实验要求:将该题目进行分解,划分任务;组内每个同学负责一部分任务的编程工作;每个人针对自己负责的工作至少提供两种实现方法,并放入整个项目流程中验证这两种方法的有效性;最后总结出两种方法的异同以及适应的范围。
实验目的:考查学生对数字图像处理应用中每个步骤的掌握程度和项目合作沟通能力。
上述实验涉及以下几个步骤。
①图像的预处理;
②图像的分割;
③图像的特征提取;
④图像的分类。
组中每个学生负责一个步骤,所有步骤都需要尽心设计,这样整体的效果才可能最好。同时大家需要协商各自负责模块的人口和出口的数据结构,保证数据能够在模块之间顺利流转。这种协商和分工合作的能力是软件工程专业最需要的技术能力之一。
以“数字号码图像识别”为例,该题目可以分割成4个步骤:预处理、数字图像切分、数字图像特征提取和数字识别。在每个步骤中都有分别需要注意的問题,如在预处理阶段,需要对图像进行去噪声,增强对比度,甚至需要进行膨胀和腐蚀将图像中断裂的数字部分连通起来;在数字图像切分阶段需要制定适应性广泛的切分策略来应对各种情况,如数字排列可以呈现任意的倾斜角度,或数字字符相连等;在数字图像特征提取阶段,我们可以考察每个数字图像的自相关系数特征,或者每个数字图像的频谱特征,也可以考察数字图像的几何拓扑特征,如将数字图像分成2个洞的(8),1个洞的(4,6,9,0),没有洞的(1,2,3,5,7),针对每个类别再提取新的几何特征;在数字图像识别阶段,可以采用神经网络的分类器,或者利用制定的一些分类策略来分类,或者采用主成份分析(PCA)的方法来识别。
4.结语
两年多的教学实践表明,新的教学大纲、授课方法和实验内容有利于激发学生的兴趣,使他们带着問题去学习,从而加深了对图像处理应用领域的了解,锻炼了编写程序和协作开发的能力。下一步我们将设计更多合理有效的案例和综合性实验,力图通过这门课激发学生的创造力。
篇5
Image Processing Algorithm Design Research Based on ImageJ
ZHAO Yi-li
(Dept. of Computer, Southwest Forestry University, Kunming 650224, China)
Abstract: Proposing an image processing algorithm design program based on ImageJ software, the program can complete digital image processing algorithm design quickly and accurately, and it is a useful complement for which based on MATLAB or C/C++ language environments. Through two examples of digital filtering and wavelet transform, the paper shows the benefits of the program for the image processing algorithm design task. Meanwhile, with the ImageJ's open plug-in architecture, making the design has good modularity and scalability.
Key words: imagej; image processing; digital filtering; wavelet transform; algorithm design
1 数字图象处理算法设计概述
在进行数字图像处理算法仿真时,采用的方案主要有两大类。一类是使用MathWorks公司开发的MATLAB软件。另外一类基于C和C++语言,以及Microsoft公司的Visual Studio平台和MFC框架。
1.1 基于MATLAB的图像处理算法设计
由MathWorks公司开发的MATLAB[1]软件非常适合用于处理向量和矩阵,在科学研究和产品的原型开发与设计中得到了广泛的应用。并且被国内外许多大学采用作为线性代数和数值计算的计算机辅助教学软件。该软件本身提供了一种高级语言,能够通过编程的方式解决问题。由于MATLAB附带了一个功能完整的图像处理工具箱[2],因此很多研究者都基于MATLAB进行数字图像处理算法的设计[3-5]。
采用MATLAB软件作为原型系统设计具有可靠和快速的优点,但是也存在三个缺点。第一,由于MATLAB是一个商业软件,软件的版权费用比较昂贵。第二,MATLAB对相应的图像处理算法行了封装。因此,很难有机会看到相关算法的实现代码。第三,在MATLAB中开发的程序必须要有MATLAB的运行库支持,脱离了MATLAB环境就无法运行。
1.2 基于C和C++语言的图像处理算法设计
另外一类设计方案基于C和C++语言。C语言是很多图像处理和数值分析库的首选编程语言。但是,使用C语言需要通过指针访问图像数据,而且需要手动进行内存的分配和释放。因此在使用C语言进行算法设计的时候,往往会把注意力转移到其它和图像处理无关的领域上面,而且C语言本身也没有提供用户界面接口环境。
随着C++语言的普及,越来越多的研究者开始采用C++语言进行图像处理算法设计。这些设计大部分都是基于Visual C++环境,并且使用MFC完成相关的用户界面接口。由于C++语言本身的复杂性,以及MFC具有相对陡峭的学习曲线,使得这个方案开发效率不是很高。言内容。
2 基于ImageJ的图像处理算法设计
为了能够解决以上提到的问题,作者在进行数字图像处理工程实践中,采用基于Java语言编写的ImageJ平台的算法仿真方案。通过一些项目的实践,取得了不错的效果。下面对采Java语言和ImageJ平台的原因进行阐述。
2.1 采用Java语言的原因
随着Java语言及其平台的日益成熟,使得Java语言[6]在多个领域都得到了广泛的应用。选择Java语言的原因是(1)Java语言是跨平台的,可以使用多个操作系统来进行算法设计,例如Windows、Linux或者Mac OS;(2)Java语言是免费和开放的;(3)Java语言带有网络开发的标准库,这使得开发基于Web的图像处理系统更加方便;(4)Java语言带有用户界面库AWT和Swing,可以将图像处理算法和处理结果的可视化无缝衔接起来;(5)Java语言是面向对象的,并且支持垃圾回收和良好的异常处理机制。这样研究者更容易把注意力集中在算法实现上面,而不是指针的操作以及内存的手动分配与回收这些与问题域无关的事物上面;(6)Java程序运行速度很快,这意味着可以得到算法运行结果的即时反馈,即实时性。
2.2 采用ImageJ的原因
ImageJ是由美国国家卫生总局的维恩开发的一个功能强大的图像处理和分析软件[7],在全世界被很多生物学家和医学图像处理研究者应用于生物医学图像处理研究[8]。由于ImageJ本身是使用Java语言编写的,因此可以运行在任何一个安装了Java虚拟机的操作系统上面。同时,在ImageJ的网站上也提供了相应的源程序和帮助文档下载,研究者可以通过下载ImageJ的源代码对ImageJ内部的工作机制和原理进行分析。最重要的是ImageJ的设计基于插件架构体系,可以通过编写插件对其功能进行扩展。利用ImageJ的插件机制,可以将不同的图像处理算法编写为相应的插件。通过Java虚拟机和ImageJ提供的插件动态加载功能,当用户对插件进行更改以后,直接编译就可以在ImageJ中进行加载和运行,而无需重新启动应用程序,即提供了所谓“热拔插”的功能。
3 图像处理算法设计示例
下面将通过两个例子来说明如何基于ImageJ平台进行数字图像处理算法设计。通过这两个例子可以看到ImageJ的插件机制为图像处理算法的实现提供了一个非常好的平台。
3.1 数字滤波
随着数字滤波是图像平滑和锐化算法的理论基础[9]。论文实现了数字滤波的两种算法,一种使用不可分离算法,另外一种使用可分离的算法。一个大小为m*n的滤波器,对于每个像素,不可分离算法的时间复杂度为O(m*n),可分离算法的时间复杂度为O(m+n)。因此,可分离算法在模块化和计算时间方面更有优势。
算法1 垂直边缘滤波器的不可分离算法
public ImageProcessor nonseparable(ImageProcessor input) {
int w = input.getWidth();
int h = input.getHeight();
ImageProcessor output = new ImageProcessor(w, h);
double[][] block = new double[3][3];
double value = 0.0;
for (int x = 0; x < w; x++) {
for (int y = 0; y < h; y++) {
input.getNeighborhood(x, y, block);
value = (block[2][0] - block[0][0] + block[2][1] - block[0][1] + block[2][2] -block[0][2])/6.0;
output.putPixel(x, y, value);}}
return output;}
算法2 垂直边缘滤波器的可分离算法
public ImageProcessor separable(ImageProcessor input) {
int w = input.getWidth();
int h = input.getHeight();
ImageProcessor output = new ImageProcessor(w, h);
double rowin[]= new double[w];
double rowout[] = new double[w];
for (int y = 0; y < h; y++) {
input.getRow(y, rowin);
difference(rowin, rowout);
output.putRow(y, rowout);}
double colin[]= new double[h];
double colout[] = new double[h];
for (int x = 0; x < nx; x++) {
output.getColumn(x, colin);
average(colin, colout);
output.putColumn(x, colout);}
return output;}
private void average(double in[], double out[]) {
int n = in.length;
out[0] = (2.0 * in[1] + in[0]) / 3.0;
for (int k=1; k
out[k] = (in[k-1] + in[k] + in[k+1]) / 3.0;}
out[n-1] = (2.0 * in[n-2] + in[n-1]) / 3.0;}
private void difference(double in[], double out[]) {
int n = in.length;
out[0] = 0.0;
for (int k=1; k
out[k] = (in[k+1] - in[k-1])/2.0;}
out[n-1] = 0.0;}
表1列出了ImageJ的均值滤波的测试时间,测试环境为:512 x 512的灰度图像,JRE 1.6.0_21,Intel Core Quad/2.33GHz,4GB RAM。从表1中可以看到可分离算法相对于不可分离算法的优势,特别是当滤波器尺寸加大以后更加明显。
3.2 小波变换
另外一个例子是实现可分离的二维Haar小波变换[10]。
算法3 二维Haar小波变换
public ImageProcessor analysis(ImageProcessor input, int nbScale) {
int nx = input.getWidth();
int ny = input.getHeight();
ImageProcessor output = input.duplicate();
ImageProcessor buffer;
for (int i=0; i
buffer = new ImageProcessor(nx, ny);
ouput.getSubImage(0, 0, buffer);
buffer = split(buffer);
output.putSubImage(0, 0, buffer);
nx = nx / 2;
ny = ny / 2;}
return output;}
private ImageProcessor split(ImageProcessor input) {
int nx = input.getWidth();
int ny = input.getHeight();
ImageProcessor output= new ImageProcessor(nx, ny);
double rowin[]= new double[nx];
double rowout[] = new double[nx];
for (int y=0; y
input.getRow(y, rowin);
split_1D(rowin, rowout);
output.putRow(y,rowout);}
double colin[] = new double[ny];
double colout[] = new double[ny];
for (int x=0; x
output.getColumn(x, colin);
split_1D(colin, colout);
output.putColumn(x,colout);}
return output;}
private void split_1D(double in[], double out[]) {
int n = in.length / 2;
double sqrt2 = Math.sqrt(2.0);
int k1;
for (int k=0; k
k1 = 2 * k;
out[k] = (in[k1] + in[k1+1]) / sqrt2;
out[k+n] = (in[k1] - in[k1+1]) / sqrt2;}}
图1是基于ImageJ设计的Haar小波变换仿真的运行结果。
3 结论
论文提出的基于ImageJ软件的数字图像处理算法设计方案对传统的基于MATLAB和C/C++语言的方案是一个非常好的补充。通过相关的两个实例也展现了这种方案在实现数字图象处理算法时的简洁和快速,对于研究者设计和验证新的图像处理算法是一个非常好的平台。同时由于ImageJ基于插件的架构体系设计,使得研究者可以将不同的图像处理算法编写为相应的插件,对其进行扩充和二次开发。
参考文献:
[1] The MathWorks Inc. MATLAB,Natwick,MA.[CP/OL].
[2] Rafael C,Richard E,Steven L.Digital Image Processing Using MATLAB [M].[S.l]:Prentice Hall,2004.
[3] 安平,王朔中.建立在MATLAB平台上的数字图像处理教学实验系统[J].实验室研究与探索,2001(1).
[4] 贾永红.现代化教学手段在数字图像处理教学中的应用研究[J].测绘通报,2006(1).
[5] 张国琴,吴周桥.MATLAB在数字图像处理教学中的应用[J].武汉科技学院学报,2005(10).
[6] The Java Language.[CP/OL].
[7] Image J.rsb.info.nih.gov/ij[CP/OL].
篇6
关键词 :研究型教学;遥感数字图像处理;教学模式;建构
DOI:10.16083/j.cnki.22-1296/g4.2015.04.024
中图分类号:G642.0文献标识码:A文章编号:1671—1580(2015)04—0052—02
基金项目:甘肃省自然基金(编号145RJZA163);甘肃农业大学重点课程建设项目(遥感数字图像处理);甘肃农业大学教学研究项目“地理信息科学专业实践教学模式的改革与实践”资助。
收稿日期:2014—10—19
作者简介:吴静(1973— ),女,四川道孚人。甘肃农业大学资源与环境学院,副教授,博士,研究方向:遥感教学。
李纯斌(1972— ),男,湖北长阳人。甘肃农业大学资源与环境学院,副教授,博士,研究方向:3S技术与应用。
付彩菊(1981— ),女,甘肃定西人。甘肃农业大学资源与环境学院,讲师,硕士,研究方向:遥感教学。
闫培洁(1985— ),女,甘肃白银人。甘肃农业大学资源与环境学院,讲师,硕士,研究方向:遥感教学。
大学研究型教学以主体教育思想、素质教育思想、创新教育思想为理论指导,注重培养学生可持续发展的能力,如自主能力、创新能力、交往合作能力等,能够很好地体现现代大学教学的本质,[1]因此,研究型教学思想自美国在20世纪80年代提出以来,得到了包括中国在内的各国教育界的积极响应和发展,取得了瞩目的成就,成为高校推崇的教育理念之一。[2]
目前,我国高校的在校学生一般都是“90后”,他们在开放的网络环境中成长,通过网络获取信息的能力较强,更希望在学习中掌握主动权,[3][4][5]适合“以学生为主体、以教师为主导”的研究型教学模式。[6]
甘肃农业大学遥感数字图像处理重点课程建设项目以研究型教学思想为指导,进行了研究型教学模式建构的探索和实践,并取得了较好的效果。
大学研究型教学的基本特点包括:教学时空的开放性;教学主体的互促性;教学方法、手段的多样性、灵活性;教学过程的探索性;教学氛围的民主性;教学评价的综合性。基于上述理念,笔者结合学生的特点和课程特征,贯穿开放意识、问题意识、探究意识和能力培养意识,[7]在遥感数字图像处理课程教学实践中建构研究型教学模式。
一、开放意识
(一)教学时空开放
遥感图像资料是遥感处理的对象,如何根据需求获取合适的遥感图像是本课程的最基本技能,也是对学生首要的素质要求。然而,下载遥感图像耗时较长,而且必须通过网络下载,鉴于课堂学时不足,同时学院实验室机房没有开通互联网,所以,我们设计了一个课外实验:要求学生利用课余时间和网络资源,下载一景遥感图像(不限平台、传感器、时间、地点等);说明下载的过程,包括网站信息、数据查询条件设置、数据下载的方式等。通过这个实验,达到让学生掌握下载遥感图像的流程、了解相关网站的目的。由于该实验具有一定的挑战性,而且最后结果明确(是否下载到图像),学生克服各种阻力完成之后,会有一种成就感。此外,由于实验中没有限制平台、传感器、时间、地点,结果也不是全班统一的,有的学生下载了学校所在城市的影像,有的下载了家乡的影像,有的下载了自己向往地点的影像,等等,体现了自己的独特性。通过教学时空的开放,达到了对实验条件扬长避短、充分调动学生积极性的效果。
(二)资源开放
1.网络资源。收集整理各种获取遥感图像资料的途径,让学生亲自去体验获取影像资料的过程,使其对不同平台、不同处理级别、不同价位、不同格式、不同内容的资料有直观认识,并熟悉网站资源和数据申请流程,及时跟进网站的更新进度,了解业界的最新动态。
2.文献资源。遥感图像处理具有一定的不确定性,而且处理方法多样,因此,在教学过程中,应为学生提供各种相关的期刊文献供其参考,让他们不仅自己会操作、与同学探讨处理过程和结果,还能看到相关专业领域的学者如何进行遥感图像处理研究。
(三)课程开放
遥感数字图像处理与遥感概论、遥感概论教学实习两门课程内容相关,但各有侧重。遥感概论侧重介绍遥感相关理论以及遥感图像处理方法及原理;遥感数字图像处理课程侧重处理的基本操作;遥感概论教学实习则是在具体给定项目中,在所学理论方法指导下,贯穿各种基本操作,实现项目目标。遥感数字图像处理每一次实验所培养的技能就像一颗颗打磨好的、散落的珍珠,遥感概论教学实习就像一条线,将每颗珍珠贯穿到一起,形成一条美丽的项链。三门课程相互衔接,前后呼应,学习、巩固、提高,不断提升学生对遥感学科的理解。
二、问题意识
以问题为导向,在实验设计中强调利用所学知识和技能解决实际问题,通过每个实验的设计以及不同实验之间的相互呼应体现问题意识。
(一)单个实验要求分两个层次
每一次实验对学生提出两个层次的要求,首先是要求其完成基本操作;在此基础上,提出任务要求,要求用基本操作解决具体问题,加深对操作的熟悉程度,同时要对此操作的目的和意义有进一步的思考和理解。
综合两个层次的练习,不仅能让学生学会操作,而且能够明白操作的目的和意义。
(二)各个实验互动呼应
如综合“实习一ERDAS视窗操作”和“实习六空间建模”设计一个习题,要求学生利用实习一的作业二的结果作为输入,运用实习六的操作完成对图像的分类。这样一方面可以加深学生对实习一的内容的理解,用更积极、深入的方式激活学生对前面所学实验的回忆;另一方面还能增强学习的趣味性,激发学生思考的积极性,达到了由实验六激活实验一的效果。
期中开设习题课,综合所学,提出思考题,引导学生想办法利用所掌握的操作技能,完成思考题,解决问题。
三、探究意识和能力培养意识
将课程与其他相关的专业学习活动联系起来,学研结合,培养学生的探究意识。指导学生参加学生科研训练项目(SRTP)、进行毕业设计与毕业论文研究,利用本课程中学到的技能和方法解决一些实际问题,完成图像的获取、预处理、增强处理、运算、得出结果和结论的全过程,并用论文的方式进行总结。鼓励学生参加国际、国内相关内容的比赛,按一定要求和规则完成相应任务。
一般来说,在SRTP、毕业设计和各种比赛中,学生们需要解决的问题比课堂上要多,包括数据的下载、数据的格式、数据的运算、各种不同来源数据之间的协同等,或者是海量数据的处理等各种问题。在解决问题的过程中,往往要求学生查阅大量文献或者需要在课程教学所用到的平台或相关软件平台的基础上进行二次开发,达到按需处理数据的目的。这个过程非常锻炼学生,能使学生在心理素质的培养、学识的积累、处理问题的能力培养等方面获益良多。
综上所述,只要根据课程特点采用研究型教学模式,将双主体意识、开放意识、问题意识、能力培养意识和探究意识贯穿于教学之中,挖掘学生学习的积极性,就能够使他们学得轻松、快乐。
[
参考文献]
[1]罗秋明,梁美华,易斌.大学研究型教学理论、方法与模式[M].徐州:中国矿业大学出版社,2005.
[2]何云峰.大学“研究性教学”的发展路向及模式建构[J].中国大学教学,2009(10).
[3]王晓雪.针对“90后”学生特点的大学英语个性化教学研究[J].科技信息,2013(10).
[4]薛晶心.认识90后大学生特征,寻求有效的教学对策[J].大学(学术版),2011(1).
篇7
数字图像处理是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。如今,数字图像处理涉及农牧业、林业、环境、军事、工业和医学等方面,有着极为广泛的应用[1-2]。然而,困扰学生的问题是所学的知识不知如何运用到实践中。因此,面对枯燥的学习,提不起兴趣。可兴趣却是最好的老师,它是主动学习、积极思考、大胆质疑、勇于探索的强大动力。因此,在教学活动中,注重激发学生的学习兴趣是一项十分重要的任务。
数字图像处理这门课程理论性、系统性强,知识面广,不仅需要较强的数学功底,如概率论与数理统计、线性代数、矩阵论等,还依赖于信号与系统、通信原理、数字信号处理等课程的学习和了解[3]。然而这些要求和学生所掌握的现状是矛盾的。数学基础薄弱以及相关先修课程掌握不扎实,使学生学习起来力不从心,因而也提不起兴趣。教学内容按部就班,重理论轻应用,课堂学习枯燥无味。相当一部分学生一学期的学习只为应付考试。以就业为目的的学生觉得似乎跟以后的就业前景也没多大关系,社会需求较小,学习没有动力;以考研为目的的学生只重视考研科目,对这门课也没有兴趣。实验内容简单枯燥,偏重验证性,学生实际扮演打字员角色,无法发挥积极性和创新性[4-5],也无法激发学生兴趣。实验内容和实际应用联系不够紧密,学生在现实生活中找不到共鸣。
2 以兴趣为导向的教学改革探索
数字图像处理是随着计算机和数学的发展而发展的一门综合性学科,教学目的是使学生了解和掌握数字图像处理的基本内容和方法,一方面提高学生的科研素养,为以后的深入研究打下基础;另一方面能够让学生具有一定的实践能力,为就业打下基础。本文以兴趣为导向,激发学生内在驱动力,以达到教学目的,拟作如下改革探索。
教学内容改革 该课程主要讲授数字图像处理的基本原理,包括数字图像基本理论、图像增强、图像变换、图像恢复和重建、图像编码和图像分割等图像处理方法。该课程涉及多种算法数学模型、公式等,并有大量的理论和程序讲解,内容多,理论性强,应用面广。为达到良好的教学效果,力求纵观全局,抓住关键,突出重点,解决难点,在实际教学中应区分主次,有侧重有取舍,使教学内容精致化。
为避免教学的纯理论化,培养学生解决实际问题的能力,在讲授基本理论时,增加相关背景知识和前沿动态介绍,激发学生的兴趣,也有利于知识的完整性和连贯性。在具体讲授图像处理基本方法的章节时,适度弱化数学推导过程,针对具体的图像处理方法,安排相应的实际应用案例。如图像增强,可以利用电视影像为例,说明利用图像处理可以提高影片中图像的质量,减低图像中的噪声,优化观影效果;图像变换,可以讨论雷达图像质量的提高,利用图像重构算法提高雷达图像分辨率,便于更好地表征目标;图像分割,可以讨论医学影像,如CT图中对于病灶区域的识别,提高医生对病情的判断;图像识别,以人脸识别为例,介绍图像处理算法在人脸识别中的运用。在生动的学习过程中培养出学习兴趣,树立学习信心,在此基础上适度地深入相关的理论推导过程。
在应用技术层面,注意理论联系实际,安排相应的专题报告。如:生物医学方面CT技术,显微图像分析和超声波图像处理等;通信工程中的编码和压缩技术;工业工程中的自动检测、工业视觉;以及军事公安、文化艺术、电子商务等。
在作业和课后习题方面,精选习题,改进传统的做题方法,让学生能够举一反三,避免重复做相似的习题,重质量轻数量;相应增加应用实践专题型课题,可以让学生根据自己的兴趣分组,选择一个专题,充分利用教材和教辅,以及图书馆和各种网络资源,做相应的小论文,将理论知识与解决工程技术问题结合起来,既巩固了理论知识,又有了实践能力,还能增强兴趣,提高学习动力,能够达到较好的教学效果。
教学方法和教学手段改革 在传统教学中,以教材、教师为中心,近乎是教师讲、学生记的模式。改革拟采用多种教学方法相结合来改变这种“讲听式”的教学模式。根据课程内容和学生特点,灵活运用启发式教学法、研讨问题教学法、过程导向教学法、项目导向教学法、任务驱动教学法、实例解析法、练习指导法等组织教学,理论实践并进,“教、学、做”三位一体。
在课程介绍时,可结合视频和图像的方式介绍目前已经运用在社会实践中的实例,增加学生的兴趣。在教学过程中,可以将不同章节的内容进行串联,介绍已有成果的同时穿插前沿动态和发展趋势,提高学生的求知欲。教学中适当地组织专题讨论,引导学生积极思考,提高学生分析问题、解决问题的能力,使他们思维变得活跃,兴趣变得浓厚,能够自主地、积极地参与学习并进行探索创新。在教学手段方面,根据不同的课程内容,采用多种教学手段相结合的方式。背景介绍以及实际应用方面采用多媒体教学,用视频形象生动地向学生展示;在理论基础及公式推导上,多采用传统的板书模式,引导学生一步步跟着教师思考,加深印象。在实验仿真和程序设计指导时可采用屏幕录影教学,有利于学生熟悉界面,可以把学习时间更多地放在设计程序上。还可以建立网络学习辅导与交流互动平台,充分发挥学生主体和教师主导作用。此外,合理安排学时,将保证在有限的学时内既完成教学任务又增强教学效果。
实验内容改革 如表1所示,传统的实验主要是验证性实验,学生把大量课时花在敲程序和调试程序上,只为得到一个验证性的答案,缺乏思考及自己对程序的理解,不利于学生能力的提高,达不到理想的教学效果。针对传统实验的不足,拟做以下尝试。
1)一般性验证实验,可以用屏幕录影的方式,在授课过程中演示,一方面有助于理论内容的理解,同时也可以起到实验预习的作用,节省此类实验时间。
2)重要的验证性实验,可以适当增加一些情境,修改一些参数,以观察它们对实验结果的影响,让学生理解并掌握其中的关键因素。
3)在完成大纲实验的基础上,增加开放性实验设计,引导学生兴趣。实验内容由浅入深,使学生在实践中提高对知识的理解以及创新能力。学生可以自由分组,鼓励编程基础好的学生作为小组负责人,带动其他学生一起完成,培养学生的独立思维能力、动手能力以及团队合作能力。
考核内容和方式改革 目前的考核方式还是沿用传统的课程考试方法,主要分期中和期末考试。形式上为笔试,内容上知识性、记忆性的东西占了绝大多数。然而每学期厚厚的一本教材,试题的覆盖面是有局限性的,而且这样的考核方式也导致学生应试现象的出现。虽然把考试应付过去了,但没有真正学到多少东西,自身能力没有多大提高,违背教学目的。
基于这样的现状,拟对考核内容和方式做如下改革探索:考试内容要与时俱进,摒弃传统、老旧的题型。在考核的内容以及广度和深度方面,任课教师有着决定性作用。任课教师应该提高自身对教材的理解力,把握好重点、难点,跟进学科前沿动态,对课后习题认真揣摩。出题既紧扣教材重点又新颖灵活,能够达到测试考查的目的,避免试题与历届试题及课后习题重复,有机会给部分学生投机取巧。
篇8
1云检测方法
根据同一卫星图像,它在各个分量上的水汽、二氧化碳、一氧化碳、甲烷等气体据有相同的属性参数,截取目标区域图像和该区域附近的无云样品区域进行处理。
由于云是不稳定因子,它随时间和空间变化而变化,即不同季节云的反射率和亮温不同,不同空间高度云的反射率和亮温又有所不同。因此,要能较好地识别云区范围就要了解它的空间和时间分布特性,并采用行之有效的方法来解决这个难题。然而鉴于不同的云相对于植被、土壤、水域等不同下垫面在可见光和近红外波段具有较高的反射率,而在热红外波段由较低的亮温,这就给我们判云带来了有利条件。针对与所选用的热红外通道,我们采用了以下几种方法进行了检测云。
1.1单通道探测值阈值检测
任取NOAA气象卫星的某一通道图像资料,并给定一个云区灰度阈值,凡高于该阈值的像元皆为云。
1.2可见光和近红外通道反射率阈值检测
计算可见光和近红外通道图像的反射率,给定反射率阈值,凡高于该阈值的为云。
1.3红外通道温度阈值检测
运用普朗克公式计算红外通道的亮温和温度,设立温度阈值,凡低于该阈值的为云。
2除云方法讨论
云检测的目的是找出云影响的测量值,回归晴空测量值后用于计算海面温度。云检测是基于观测目标自身的特性,比如,海面温度梯度变化不大;在红外和可见光波段中,海面较云顶有较高的温度和低得多的反射率;海面和云顶在不同红外窗区通道反射率上的差异等,推测出有云影响的数据。
在气候变化中,云与辐射起着关键的作用,云层影响着地球的辐射收支地球表面温度以及气候变化趋势。遥感图像处理中,与覆盖时最常见的噪声之一,它不仅对图像的处理带来诸多困难。
2.1国外遥感温度研究
从70年代开始,研究者开始尝试从机理方面着手研究亮温与地表温度的关系。由于卫星获得的亮温是由大气顶层接收的辐射亮度值换算而成的,而大气对遥感器接收地表信息的影响较大,所以早期的研究主要集中于大气辐射校正上。到目前为止,己经研究出很多辐射校正方法,但是这些方法大部分都需要其它气象数据的支持,比如不同高度的大气湿度等。
大气校正方法比较烦琐,后来有的学者基于相邻波段大气吸收特性提出了一种全新的方法,直接运用两个波段的亮温数据去推算地表的温度。这就是一种比较简单有效的温度反演方法,即分窗口技术法(Split-windowTechnology),该方法可在少量的地表参数支持下从气象卫星数据反演出地表温度。目前温度反演研究主要集中在NOAA卫星图像的热红外波段。
2.2国内遥感温度研究
国内在遥感地表温度研究中主要采用的还是数理统计方法,此后沿袭这些研究思路和研究方法,特别是中国科学院遥感应用研究所在土壤水分方面进行了大量的研究,但是作为其中最为重要的参数之一的地表温度的研究却进展不大,没有跟上国际上由数理统计研究取得的结果。
北京大学学者提出了一种新的改进分窗口技术方法,该方法的特色之处在于引入相邻像元的概念。研究者给定了两种情况下的温度反演法,第一种情况是假设地表辐射率已知,然后运用迭代反演方法求解地表温度。该方法模拟结果与其它共5种模型结果分析比较,精度有较大的提高。第二种情况是地表辐射率未知,来反演地表温度与辐射率。这时采用双通道双像元法去求解相应的参数。通过模拟计算取得了较好的精度,在大气廓线总水汽含量误差小于10%时,反演的温度均方根误差0.7。辐射率均方根误差0.013,地表辐射项的均方根误差小于0.6%,己经可以满足陆地表面温度反演1的精度要求。
双通道双像元法是经典分窗口技术法的延伸,利用相邻像元间辐射率之间的关系,在地表辐射率未知的情况下反演地表温度是个很好的方法。但是该方法也有局限性,在大气水汽含量误差大于20%时,反演的温度误差就会显著增加。
陆面温度反演中分窗口技术法经过不断改进,反演精度有所提高,但是这些改进的方法还没有达到大面积应用阶段,更不能像海温研究那样进入业务运行阶段,因此,要达到陆面温度反演的实用化程度,还需要继续拓展。最近几年遥感界出现了一个热门的研究领域,就是多角度遥感数据反演研究,这个方法可能为组分温度遥感提供一个新的思路。
参考文献
1 陆玲,王蕾,桂颖.数字图像处理[M],北京:中国电力出版社, 2007.
2 高成,董长虹,郭磊等.Matlab 图像处理与应用(第二版)[M],北京:国防工业出版社.2006.
3 何东健,耿楠,张义宽. 数字图像处理[M],西安电子科技大学出版社,2003.
篇9
“数字图像处理”是为了适应现代装甲车辆战场信息获取与信息处理的要求而开设的一门专业基础性课程。数字图像处理技术大量的研究、教学文献、资料均是以英文形式出现的,直接以原文为信息源来理解相应理论和方法,可以减少因翻译者的认知偏差而产生的误解,从而更为准确地把握相关的前沿问题。从对外交流和知识更新的角度看,这门课非常适合双语教学模式。
学员成绩是衡量双语教学效果的重要方面之一,然而试卷的难易程度、考试方法、教员评卷的宽严程度均会影响学员的成绩。教学活动是教学双方参与的活动,学员是教学活动的最直接的感受者,因而最有资格评价教员的课堂教学效果与质量。笔者从2004年起一直承担着“数字图像处理”双语教学课程建设和授课任务,授课对象是光学专业大三本科学员。在教学中,笔者感到授课对象的英语水平参差不齐,课堂参与程度并不理想。鉴于此,笔者以所授班级全体学员为调查对象,在学期末课程结束后做问卷调查,旨在通过学员对双语教学的评价,考察双语教学的实际教学效果,并探求保证教学效果的最佳途径。
一、对象与方法
此次调查的对象是“数字图像处理”双语授课的全体学员,调查采用的问卷是选择式问卷,主要包含以下6个方面内容:学员通过英语四、六级情况、对双语教学主要目标的认知、对教材的看法、对课堂教学的适应情况和期望、双语教学的收获、影响学员学习效果的因素。为了准确反映学员的真实想法,调查采取不记名问卷方式,统一发放并回收。共发放问卷31份,收回31份,有效问卷31份。
二、结果与分析
1.学员通过英语四、六级情况
通过四级27人,占87%;通过六级4人,占13%。从外语水平看,学员的外语基础较好
2.对双语教学主要目标的认知
学员对双语教学主要目标的认知情况(多选项问题)调查结果显示,认为“提升外语知识和能力”的占71%,排在首位;其次为“开拓国际视野和意识”的占61%;再次为“提升专业知识和能力”的占58%;最后是“学习外国先进教育理念”的占48%。但是,不同外语水平的学员对双语教学主要目标的认知情况有所差别,通过四级的学员选“提升外语知识和能力”的人数最多,占74%;而通过六级的学员选“提升专业知识和能力”的人数最多,占75%。可见英语水平越高,对“提升专业知识和能力”的认同度越高。
3.对教材的看法
本课程选用的教材是冈萨雷斯的Digital ImageProcessing,但由于受到课时限制只选取了其中的部分章节作为教学内容。为了便于学员自学,还自编了一本与教学内容同步的词汇手册。从调查结果看,认为教材“很难”或“较难”的占58%;认为教材“一般”或“较容易”的占32%。而对于词汇手册,74%的学员持肯定态度,认为对学习有一定的帮助。调查中还发现,约10%的学员对教材的难易程度以及词汇手册的辅助作用认识比较模糊,选择了“不好说”一项,这说明他们对本课程所选用的教材和词汇手册并不熟悉。造成这种情况的原因可能是:他们对课程本身并不感兴趣,或是尚不知如何学习本课程。
4.对课堂教学的适应情况和期望
统计结果表明,84%的学员在一开始并不能适应双语教学模式,然而经过一段时间后均能适应双语模式。这说明双语模式对学员来说并不是无法跨越的鸿沟,只要给予一定的锻炼过程,绝大部分学员都能习惯这种教学模式。但是调查中也有约10%的学员选择“一直不适应”,这主要集中在仅通过四级的学员中,在已通过六级的学员中并没有人选此项,可见外语水平越高,双语模式的适应情况越好。
在“数字图像处理”双语课堂上,课件是必不可少的,它承载了很大信息量,比如重点词汇、一些不易直观接受的内容,用课件展示出来,非常有助于学员的理解和记忆。调查发现,94%的学员希望授课的课件为中英文混合形式,然而他们所期望课件的中英文比例差别较大,其中选“中英文各半”的占21%,选“英文为主中文为辅”的占41%,选“中文为主英文为辅”的占38%。这与学员所希望的课堂上的中英文授课语言的比例相类似。这说明在双语教学中,一味追求全英文授课,很有可能导致学员对双语教学的不认同,最终影响双语教学效果。但是,需要注意的是,中英文混合授课时无论以哪种语言为主,都要避免“双语混合疲劳”现象产生。所谓的“双语混合疲劳”指的是,为了满足学员对课堂语言的要求,在课堂上总是混合使用两种语言,打破了学员的正常思路,导致学员对课程内容无法理解。这样的授课方式笔者曾经尝试过,比如在讲授某一知识点时,先用英语讲一遍之后再用汉语讲一遍,发现学员根本无法跟上教学节奏,这主要是由于他们的注意力完全被中英文之间的对应关系牵扯住,从而忽视了对教学内容的理解。同样,在课件的制作中也要避免“双语混合疲劳”现象。 转贴于
5.双语教学的收获
双语教学的收获的调查分两个方面,专业知识和外语水平。71%的学员认为双语教学对专业知识有一定的促进作用,而81%的学员认为双语教学对外语水平有一定的提高作用。可见学员对外语方面收获的认同程度大于专业知识方面。这恰与学员对双语教学主要目标的认知相吻合。但是,笔者认为双语教学的主要目标绝不是语言教学,也不是为了扩展学员在专业领域的外语词汇量,而应该是以讲授专业知识为主线,以系统地掌握一门专业知识为主要目的。为了避免本末倒置,在教学过程中,要重视对学员教学目的的教育;同时,教员在备课授课中,要注重课程前延和后续相关学科知识的衔接,不要让双语课程孤立,让学员能够将这门课程的专业知识纳入自己的专业知识体系。
6.影响学员学习效果的因素
调查发现,74%的学员表示“不认识专业英文词汇”是他们学习本门课程的主要困难。约65%的学员认为“教材参考词汇表”是学习本门课程有效的辅助措施。这说明在授课中,同步词汇手册对学习本门课程非常重要。87%的学员认为“中英文参考资料”对学习本门课程很有效。关于这一点笔者认为,如何给学员提供适当的中英文参考资料需要慎重考虑,资料不宜太多,否则会与教学内容偏离,适得其反。
三、对保证双语教学效果的建议
对双语教学效果的评价有多种,如领导评价、专家评价、同行评价、学员评价等。此次调查从学员角度出发,符合以学员为中心的教学模式。针对调查中发现的问题,为保证教学效果,在今后的教学中需要把握以下两点:
(1)加强学员双语教学目的的认知教育,避免学员学习中过分强调语言而忽略专业知识。
(2)教学内容要深入浅出。教员在授课中,除了对讲授内容要了如指掌,做到放得开、收得拢以外,还应洞察学生心理,了解学员对知识的掌握情况。不要只站在教的角度考虑问题,还应从学的立场出发,将要讲的内容转化成学员渴求的知识传授给学员。
双语教学是一项实施成本较高的课程教学,如果没有好的教学效果,不仅造成人力、物力、财力等资源的浪费,还会对下一步的推进造成不利影响,因此每门双语教学课程都要重视教学质量。
篇10
Based on ITK and VTK Cone-Beam CT Medical Image Visualization
BAI Guang-yuan, LI Hai-bo
(Nanyang Institute of Technology, Nanyang 473000, China)
Abstract: In medical image visualization, cone-beam CT using FDK filtered back projection algorithm, using the DICOM standard format, using the image tool library in ITK and VTK for 3D volume rendering can be achieved on engineering and practical requirements. The article presents theories, research and feasibility analysis, gives a complete solution.
Key words: cone-beam CT;FDK;DICOM standard format;ITK;VTK
1医学图像可视化
科学计算可视化( Visualization in Scientific Computing,简称ViSC)是数字图像处理学科的新领域,医学图像可视化研究是其中一个重要发展方向。1987年美国国家科学基金会(National Science Foundation,简称NSF)顺应学科发展和实际需求,召开专题研讨会,正式提出“可视化”一词。会议之后以正式报告的方式,给出科学计算可视化的科学定义、研究方向和远景目标。1991年美国国家医学图书馆联合科罗拉多大学医院建立起男女标本各一的全部人体解剖结构数据库。世界范围内在遵循许可并支付费用的情况下,可将这庞大的归档数据应用于教学、科研和临床领域。这一项目称之为可视人体(Visible Human)计划,在这个计划中,中国走在了世界前沿。重庆第三军医大学和广州第一军医大学完成了相同的工作,数据库所用人体标本健康程度更高,其采集切片数据更加精细。医学图像可视化技术在医学教学科研领域和临床诊断方面逐渐起到越来越重要的作用,并有着广阔的应用前景。
2锥束CT和FDK滤波反投影算法
提高X射线利用率和缩短成像时间一直是CT技术的一个重要发展方向。现阶段,大锥角的锥束CT成像技术取形束和扇形束方式,进入了实用化和商业化的轨道。通过采用大锥角放射源和大平板检测器等硬件设备,人体组织受X光线照射剂量只有传统笔形束的六十分之一或相同量级,同时大大降低设备的运行成本。
对锥束CT生成的断层图像重建,主要应用FDK滤波反投影重建算法。FDK算法是一种基于圆形轨道扫描重建的近似算法。如图1所示,在圆形轨道上R为圆轨道的半径,γ为扇形角,κ为锥角,β表示投影角度可得滤波积分公式如下所示:
Feldkamp, Davis和Kress(1984)在其论文中给出了详细的数学证明。FDK在中心平面是精确重建,离中心平面越远,重建误差越大。其各种衍生算法主要从轨道不同和误差修正两个方面给出更适合实际情况的修改和调整。FDK算法由于其几何典型性和计算简洁性,成为实际锥束重建中应用最为广泛的算法和基础的解决思路。
3DICOM格式
DICOM的全称是医学数字成像和通信标准(Digital Imaging and Communications in Medicine)。1988年由美国放射学院(American College of Radiology,简称ACR)和国家电气制造商协会(National Electrical Manufacturers Association,简称NEMA)发起共同制订。1992年,在北美放射学会(Radiological Society of North American,简称RSNA)上被命名为DICOM并沿用至今。DICOM标准的和使用彻底结束了医学图像通信杂乱无章的局面,确定了医学图像通信的标准形式,并真正在应用领域取得了预期的目标。
DICOM标准是一个完整的图像通信标准,涵盖了医学数字图像的采集存储、分类归档、交换传输、医务流程五个方面的详细约定。结合计算机行业发展的已有成果,应用了其面向对象的解决方式,并开放前瞻地将便于交换互联的通信协议确立在制订之初。
DICOM文件层级结构采用了面向对象的思想,建立起信息对象(Information Object Definition,简称IOD)的存在关系。同样的方式在计算机领域也应用在关系型数据库中,关系模型即实体―关系模型(Entity-Relationship ,简称E-R)。E-R结构描述了事物之间所存在的关系映射。如病人情况、数字图像、诊断报告、就诊流程等实体之间是通过怎样的映射关联到一起的。通过抽象出来的信息对象反映相关的实际信息。
DICOM文件由为文件头和数据集两部分组成。文件头中前言长度为128字节,它的存在是为了提供与通用数字图像格式位图文件(Bitmap Picture)一致的访问方式。当一个文件被切割成多个部分时,文件头可以提供图像的顺序信息。前缀作为文件格式的声明,为ASCII码“DICM”。
数据集,代表一个信息对象的实例,包含多个数据元。每个数据元由Tag号表明其在数据集中的顺序,再由VR,VL,VF(即数据类型、值长度、值域)三部分组成,进行数据实际的存储。图2 DICOM文件结构层次图
DICOM开放互联的特点体现在采用了基于已经广泛应用的IT行业ISO/OSI协议和TCP/ IP协议的网络互联进行医学数据的通信和交换。通过扩展TCP/IP协议的应用层,实现同类应用间的相互操作。
4ITK和VTK工具库
与视觉化函数工具库VTK(Visualization Toolkit)不同,ITK(Insight Segmentation and Registration Toolkit)完全面对医学图像处理。其核心功能涵盖了图像滤波、图像分割和图像配准几乎所有数字图像处理算法。在其他产品也可完成工作的情况下,ITK以其高效易用的特点被广泛应用在医学图像处理的前期步骤中。如使用ITK完成读取DICOM数据,进行滤波、图像分割和图像配准,然后输出成VTK识别格式,由VTK进行重建。
VTK作为通用的数字图像处理类库功能强大,可以进行广泛的数字图像处理、计算机图形学和科学计算可视化相关工作。与ITK配合使用,一般使用其三维重建功能。
VTK适用于快速二次开发,存在以下一些优势:
1)VTK具有设备平台无关性和良好的可移植性,并可以根据具体情况选择底层图形库如OpenGL等。
2)VTK的体系结构和具体实现优雅健壮,实现了流式数据处理和有效的缓存管理,使编程人员可以专心于图像重建的核心工作。
3)在三维重建算法上,体绘制和面绘制两种方式VTK均给予了实现,根据具体情况,可以灵活选择。
三维图像的重构方法分为面绘制技术和体绘制技术两大类。在面绘制技术中,移动体元算法(Marching Cube,简称MC)具有典型性。通过阈值选取设置空间等值面,获取数据场中体元与等值面交集情况,以等值面作为依据标准进行图像绘制。
作为最广泛使用的传统面绘制算法,VTK中相关实现如类vtkImageMarchingCubes等。
在计算机图形处理硬件性能有较大限制的情况下,面绘制只考虑等值面,取得了不错的处理速度。随着计算机硬件的不断发展,更贴近实际物体三维显示效果的体绘制逐渐实用化。体绘制考虑每个体素在最终图像绘制中的影响,不再构造曲面或平面信息,直接显示三维全貌。
体绘制根据空间规则情况,采取了两种处理方式,即空间域方法和变换域方法。后者需先将体数据进行域变换然后进行相同的工作。
工程领域,空间域方式被广泛应用,典型的算法有四种:光线投射法(Ray-Casting),错切-变形法(Shear-Warp),抛雪球法或成为足迹法(Splatting),3D纹理映射硬件辅助方法(Hardware-assisted 3D texture-mapping)。
变换域方法的实用价值在现阶段稍有不足,大多处于研究阶段。其中基于小波的体绘制法(Wavelet-Based Volume Rendering )和频域体绘制法(Frequency Domain Volume Rendering)在实际工程上有一定的存在价值。
VTK对几乎所有体绘制相关算法都有具体实现,如VTK通过vtkVolumeRayCast类及相关子类提供了光线投射体绘制算法的实现。
VTK因其算法实现较为完善和广泛,适用于工业和医学三维重建,开发人员拥有充足的选择余地。
5结论
篇11
1993年Mallat和Zhang提出了信号的稀疏表示,在信号逼近上取得了出色的表现,迅速引起了广大学者的普遍关注,信号稀疏表示研究很快被从一维信号推广到二维信号图像的研究上。
稀疏表示的模型可以表示为:
式中为向量的l0范数,表示向量x中非零元素的个数,x即为信号y的稀疏表示。
在数字图像处理中,由于图像的数据信息具有冗余性,为冗余字典,因此可以在冗余字典上进行稀疏表示,y则为图像子块的列向量表示。如何构造表达能力强、训练简单的冗余字典是图像处理中的关键一步,自稀疏表示理论的提出,在图像去噪、去模糊、超分辨率、图像修复等方面得到了广泛的应用,取得了比传统方法更好的处理结果。
1 稀疏表示理论在提高数字图像质量中的应用
Michael Elad是较早将稀疏表示理论应用于图像去噪与超分辨率的代表人物[1],他将K均值聚类方法引入字典训练过程中。在K均值算法中,求解一个包括K个代码的码本,使得在此码本上,根据最邻近分配法则,对包含N个信号的集合进行分类,得到最佳分类。在稀疏表示中,稀疏表示的过程可以看做广义矢量量化过程,其中的每个信号用多个代码的线性组合表示。当要求K-SVD中的每个信号只能用一个原子来近似时,K-SVD算法就退化为K均值算法。K-SVD在稀疏编码与字典更新之间交替迭代,保证总误差单调下降,因此可保证能收敛到局部(或全局)最小值,从而得到性能优良的过完备字典。K-SVD训练字典方法广泛的应用在图像复原问题上。基于K-SVD训练得到的过完备字典,取得了较好的图像去噪与超分辨率结果。
统计学中的主成分分析(PCA)的概念,也被引入到字典训练当中。在统计学当中,变量个数太多会增加问题的复杂性主成分分析作为一种统计分析方法,它可以从多元事物中解析出主要影响因素,简化复杂问题。PCA的核心思想,就是将高维数据投影到低维空间。寻找 r 个新变量,使其反映事物的主要特征,每个新变量是原有变量的线性组合,体现原有变量的综合效果,则这 r 个新变量称之为“主成分”,它们两两正交不相关。这 r 个主成分可以在很大程度上反映原来变量的信息。Hui Zou引入了SPCA(Sparse PCA)的概念,他修改了传统的PCA方法,利用主成分负载的稀疏性,使算法变得更加易懂,且得到更为稀疏的结果。
形态学成分分析(MCA)作为一种新兴的信号分解方法,吸引了很多人的注意。MCA根据图像信号组成成分的形态差异性,将图像内容分割为纹理区域和卡通区域。不同区域其拟合字典类型不同。小波变换可以很好的表示图像光滑区域的特征,curvelet变换通过带方向的局部傅里叶基,可以有效的处理边缘特征。离散余弦变换(DCT)以及Gabor变换是纹理区经常采用的两种处理方式。MCA充分的考虑了图像的结构组成部分以及内部特征,广泛用于盲源分离、图像分解、图像修补等。
Julien Mairal将自然图像的自相似性引入到图像恢复模型中。图像的自相似性,其根本是自然图像的统计特征。Julien Mairal非局部模型与稀疏编码结合成一个框架,将噪声在相似块之间进行平均,取得了较好的去噪、去马赛克结果。同样,自相似性在图像去模糊、图像修补方面也展示了其良好的性能。
Weisheng Dong提出了一种新的图像复原模型CSR,利用减小退化图像分解系数与原图分解系数之间的差异来达到复原图像的目的,其本质是自相似性的应用。在超分辨率方面,他提出了自适应稀疏域选择超分辨率算法,认为超分辨率重建结果的优劣很大部分取决于稀疏域的选择,对输入的样本先采用K-均值聚类,采用PCA算法进行词典训练,将非局部相似性(NL)和图像去噪中的自回归(AR)模型与超分辨率重建模型有效结合,提高了超分辨率重建质量。
Nebojsa创造性的提出了图像摘要的概念。他将图像的特征提取为一幅摘要图,在图像处理过程中,对该摘要图进行分解处理,这是合理并且有效的。Louise 利用该思想,在图像去噪方面取得了较好的去噪结果。
Kostadin在变换域,通过一组协作滤波器,将一幅图像中结构相似的二位块聚合成一组,形成一个三维模型,以增强其表示的稀疏性。Aram利用该3D理论,建立了一个新的图像模型―BM3D。BM3D在图像复原方面表现了其卓越的性能。
最近,保持图像几何结构的思想吸引了很多人的注意。Samy Bengio将图像分割成相互重叠的块,结构相似的块组成一个群组,分别对每个组进行分解训练,这就是群组编码的思想,其基本思想类似于非局部思想,也是利用了自然图像的自相似性。关于结构稀疏方面的研究展示了结构分组比简单不重叠的分组更一般的特性。例如,树状分组或是重叠分组。结构稀疏正则化具有十分广阔的应用前景。结构稀疏PCA作为一种新型的有效的非凸稀疏方法,在字典训练方面,可以取得较为理想的结果。
纵观稀疏表示理论出现以后的图像处理论文,广大研究者着重于研究如何获得表示能力强的冗余字典,以及通过结合多重约束,如平滑约束,相似性约束,几何结构不变性约束等来得到高质量的图像,近年来取得了很大的进展。但是稀疏表示属于一种优化问题,涉及到字典学习和稀疏求解的计算过程比较复杂,因而对于该理论在图像的实时处理上受到了限制,因此如何缩短计算时间也是这个模型急需解决的问题。
2 结语
篇12
Image Fusion Based on Wavelet Transform Method
WANG Chen,QI De-ning,CHU Bin-bin,PANG Lu-lu
(Artillery Academy of PLA Information Engineering Teaching and Research,Hefei 230031,China)
Abstract: This paper introduces the basic principles of image fusion, the structure models and applications, the brief image of the Mallat wavelet decomposition and reconstruction algorithms. The Matlab7.0 environment, the use of Daubechies wavelet (dB4) filter treatment of fusion images of the three orthogonal wavelet decomposition, using edge-preserving low-frequency coefficients, high-frequency coefficients of the largest energy, based on the rules of regional integration, and integration of image quality evaluation.
Key words: image fusion; wavelet transform; integration of quality assessment
20世纪90年代以来,随着图像传感器技术的迅猛发展,多传感器图像融合技术引起了人们越来越多的关注。特别是近年来,数字图像处理技术、数据融合技术及小波变换等理论的发展,使图像融合技术研究更加成为众多研究者的研究热点。图像融合在遥感、自动目标识别、计算机视觉、机器人智能、网络安全、工业检测、等领域都起着重要的作用,尤其在军事指挥领域,以多传感器图像融合为核心内容的战场感知技术已成为现代战争中最具影响力的军事高科技技术[1-2]。
图像融合就是根据某一算法,将来自不同传感器(或同一传感器在不同时间或不同观测角度)对同一目标或场景观测得到的多幅图像进行处理,从而得到一幅新的、达到某种要求的、对目标或场景的描述更加准确、更加全面、更加可靠的图像。数字图像融合充分利用了多个被融合图像包含的互补信息,大大增加了融合图像包含的信息量,同时也将多幅被融合图像中的冗余信息去除掉,提高了系统的可靠性,从而高效利用由多传感器获取的图像信息。数字图像融合系统结构模型如图1所示。该模型将图像融合评价的信息加入到融合规则的选取和参数的选择过程中,可以更充分地利用信息源提供的信息[1-3]。
1 图像的小波分解与重构[1,4]
对二维图像信号进行小波分解与重构,即在空间L2(R2)对信号进行二维可分离正交多分辨率分析,Mallat算法的实现使得小波在图像处理领域的应用成为可能。图像Mallat算法一层小波分解即对图像矩阵先进行行小波变换,再进行列小波变换得到图像的四个频带――低频近似部分子图LL,高频细节部分水平方向子图HL、垂直方向子图LH和对角线方向子图HH,如图2所示,下一层分解仅在LL子图上进行。
设{Vj}j∈Z 是L2(R)的一个多分辨率分析,?准为尺度函数,?鬃为小波函数,{hk}k∈Z 为对应尺度函数的低通滤波器系数,{gk}k∈Z 为对应小波函数的高通滤波器系数,图像小波分解的Mallat算法如下:
图像小波重构的Mallat算法如下:
2 基于小波变换的图像融合
2.1 融合规则的确定[1,5]
图像融合过程中,融合规则的选择对于最终的融合图像的质量是至关重要,设计图像融合的融合规则的理论基础是小波变换后低频子带表征的是图像近似部分,而高频子带表征的是图像的细节信息。高频子带的系数在零值左右波动,绝对值越大的系数表示该处灰度变化越剧烈,即包含图像的重要信息,如图像的边缘、线条以及区域的边界。另外,同一场景经过不同的传感器得到的图像,其低频近似部分的系数值差别不大,而高频细节部分却存在显著差异。因此,本文采用小波域低频系数采用边缘保持,高频系数采用基于区域能量最大的规则。
2.2 图像融合步骤[3,6]
对二维图像进行N层小波分解,最终有(3N+1)个不同频带,其中包含3N个高频带和一个低频带。基于小波多尺度分解图像融合方案如图3所示,图像融合的基本步骤为:
1)将待融合图像进行小波塔式分解;
2)按融合规则对各频带层分别进行融合,得到融合后各高频带和低频带小波系数;
3)将融合后各高频带和低频带小波系数进行图像重构,得到融合后的图像。
2.3 图像融合实验
待融合图像如图4(a)(b)所示,在Matlab7.0环境下,采用Daubechies小波(dB4)滤波器组对待融合图像进行了3级正交小波分解,对两个分解后的图像以小波域低频系数取平均、高频系数模值取大的融合规则进行融合,经过小波逆变换,重建图像,实验结果如图4(d)所示。图4(c)为对应像素灰度值取大的空域直接融合结果,从视觉感受而言,小波域融合能够取得较好的效果。
2.4 融合图像质量评价
融合后图像效果的质量评价研究,对于在实际应用中选择适当的融合算法,以及对现有融合算法的改进和研究新的融合算法都具有十分重要的意义[2,4],一般有主观评价和客观评价两类。主观评价是由专家进行诸如好、较好、一般、不好等定性的等级评分,主观因素造成评价标准的不同一,具有很大局限性;从信息理论与图像处理的角度出发,依据评定方法所需条件的不同,图像融合效果的客观质量评价分为基于标准参考图像的质量评价和无参考质量评价[2,3]。通常情况下,不存在标准参考图像,因此无参考质量评价更具有实际意义,本文在无标准参考图像的情况下,根据图像自身统计特性对其进行评价,选取以下四个常用评价指标(设融合图像用F表示,L表示图像F的总灰度级数,行数M、列数为N)。本文实验选取各图像的客观评价指标见表1。
1)灰度均值:指图像中所有像素灰度值的算术平均,对人眼反映为平均亮度,其定义为:
2)标准差(Standard Error):反映灰度相对于灰度均值的离散情况,即图像反差的大小,标准差越大,则图像灰度级分布越分散,包含更多的信息。其定义为:
3)图像信息熵(Entropy):反映其包含的信息量的多少,熵值越大,信息量越多,定义为:
其中,p(i)表示灰度值为i的像素数目与图像总像素数之比。
4)清晰度,又称为平均梯度,反映图像细节反差程度和纹理变化特征,一般来说,平均梯度值越大,表明图像越清晰。定义如下:
其中,ΔFx ΔFy分别为融合图像F在X与Y方向上的差分。
3 结束语
根据图像多分辨率分析理论,在小波域采用低频系数取平均、高频系数模值取大的融合规则进行融合实验,相对于空域直接融合,取得了较好的效果,但基于区域特性的融合规则大大增加了运算量。近年来,多尺度几何分析开始应用于图像处理领域[7],该理论的发展将为图像融合技术提供新的思路和解决方案。
参考文献:
[1] 敬忠良,肖刚,李振华.图像融合―理论与应用[M].北京:高等教育出版社,2007:10.
[2] Shi Wenzhong, Zhu ChangQing, Tian Yan.Wavelet-based Image Fusion and Quality Assessment[J].International Journal of Applied Earth Observation and Geoinformation,2005(6):241-251.
[3] 李伟.像素级图像融合方法及应用研究[D].华南理工大学博士论文,2006.
[4] 孙延奎著,小波分析及其应用[M].北京:机械工业出版社,2005.
篇13
引言
数字工业摄影测量技术是随着摄影测量技术、计算机技术和遥感技术的发展而形成的新兴技术,是指对非地形目标进行摄影并确定其外形、形态和几何位置的技术。数字工业摄影测量技术融合了数字近景摄影测量的基本原理、计算机视觉的相关理论、计算机技术、数字图像处理技术、模式识别等学科的理论和方法,利用数字像机获取被测目标的数字影像来得到物体的形态、位置、姿态和运动从而完成对物体的测量。由于该技术利用计算机处理信息,属于非接触性测量技术。具有危险性低、信息容量高、信息易存储、可重复使用、精度高、速度快等优点。因此广泛应用于国民经济、科技研究和国防建设等领域。随着科技的不断向前发展,研究的进一步深入,数字工业摄影测量将向实时近景摄影测量发展,它将成为对非地形目标进行测量的主要手段,并且实时性、全自动源数据获取及仿真虚拟手段的研究将成为应用研究的趋势。
一、数字工业摄影测量技术的发展历程
(一)国外发展历程
早在上世纪60年代,国外就开始了数字工业摄影测量的研究。将摄影测量的相关理论、算法及软硬件逐步应用到工业测量领域,促进了工业的发展。数字工业摄影测量技术快速发展阶段始于90年代,随着计算机技术的快速发展和日益普及,同时工业对高精度摄影测量技术的要求越来越高,工业摄影测量技术逐步进入数字化时代。目前,数字工业摄影测量理论趋于完善,技术趋于成熟。
国外已经有多家公司推出了自己的数字工业摄影测量系统:美国大地测量公司的“V-STARS系统”、挪威Metronor公司的“Metronor系统”和德国Aicon3D公司的“DPA-Pro系统”等。
(二)国内发展历程
国内对数字工业摄影测量的研究开始于70年代。当时,一些研究机构就开始着力于摄影测量技术在工业领域的应用。由于知识的落后和生产水平的限制,该技术仍处于起步阶段,发展较为缓慢。90年代初,随着高精度摄影测量技术的进步,工业摄影测量技术大量应用在冶金、机械、车辆和采矿等工业领域,并且取得了显著的成效。同时,高校及研究机构对有关工业摄影测量技术的国内外相关理论及工程实践进行了研究,并针对数字工业摄影测量技术如何应用在工业测量领域提出了一系列创新理论,形成了一套新的。该阶段为初步发展阶段。数字工业摄影测量技术在理论和应用方面都有新的发展。目前,数字工业摄影测量技术已经进入快速发展阶段。随着摄影测量技术、计算机技术和遥感技术的快速发展以及国内工业的飞速发展,许多研究机构引进国外的先进摄影测量技术、吸收新的工业摄影测量理念。 在数字工业摄影测量方面进行了很多的研究及应用工作。
目前,国内数字工业摄影测量产品主要有:天津大学研制的“汽车车轮定位参数激光视觉测量系统”、西安交通大学研制的“大型复杂曲面产品的反求和三维快速检测系统”和武汉大学研究的“Lensphoto”等。
二、数字工业摄影测量的关键技术
数字工业摄影测量技术是指对非地形目标进行摄影并确定其外形、形态和几何位置的技术。它属于高精度、大尺度三维坐标测量。为满足以上要求,需要解决以下关键性技术问题。
(一) 高质量影像的获取
获取高质量数字图像是高精度测量的基础之一。数字工业摄影测量技术需要对测量中使用的人工标志及其属性、光源特性、数字像机的设置和与成像质量有关的技术和设备等进行研究。
(二)摄影测量的人工标志
数字工业摄影测量技术使用人工标志作为测量的特征点。工业部件表面通常缺乏丰富、明显的纹理信息,在摄影测量过程中产生的图像,往往缺乏足够的、准确的特征点。为了避免这一不足,数字工业摄影测量中,采用设置人工标志点的方式产生足够数量且对比明显的特征点。发光二极管、投影激光、回光反射标志等均为人工标志点。
(三)圆形人工标志偏心差
在高精度工业摄影测量中,标志中心点定位偏心差是影响测量精度的因素。确定偏心差数学模型以及模型矫正工作有利于提高测量精度。
人工编码标志
使用人工编码标志可以加快测量速度,实现测量的自动化。每个编码标志对应一个唯一的编码,因此能够利用数字图像处理技术进行自动识别。设计编码标志应遵循以下原则:具有足够的编码容量、尺寸不宜过大、有唯一定位点和易于自动、准确识别。在数字工业摄影测量中,常用的编码标志有同心圆环型编码标志和点分布编码标志。同心圆环型编码标志采用二进制编码原理,具有原理简单、易于识别等优点。点分布编码标志由一组圆形标志点按照一定规则排列而成。
数字工业摄影测量技术发展趋势
现阶段,数字工业摄影测量技术在理论研究和工业实践方面都日趋完善。经过几十年的发展,该技术逐步走向产品化、实用化和高效化。从数字工业摄影测量技术的发展历程和现状,可以预测其发展趋势。
相机呈多样化、专业化
数字工业摄影测量常用的传感器主要是数码单反相机、红外相机、工业摄像头等。数码单反相机的价格低廉且成像性能强大,成为摄影测量的常用传感器。研究者也对单反相机进行了专业改进,使其更加适用于摄影测量。
测量精度、自动化程度不断提高
工业部件制造精度、表面复杂程度不断提高,数字工业摄影测量技术也必然向着高精度、超高精度和高度自动化方向发展。
三维数据分析软件专业化、精细化
获取三维坐标信息是数字工业摄影测量的基本功能。获取的三维坐标信息需要处理分析,才可以应用到所需的领域。多样性和复杂性的应用领域需要我们针对不同用户开发各种专用的、精细的数据分析软件。
结语
数字工业摄影测量技术是随着摄影测量技术、计算机技术和遥感技术的发展而形成的新兴技术,是指对非地形目标进行摄影并确定其外形、形态和几何位置的技术。数字工业摄影测量技术随着科技的不断进步、研究的不断深入,数字工业摄影测量将向实时近景摄影测量发展,它将成为对非地形目标进行测量的主要手段。