引论:我们为您整理了13篇编码技术论文范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。
篇1
1.2网络编码的构造方法
在对网络编码的研究当中最主要的一个问题就是结点要根据哪种方式对所接受的数据分组进行编码组合。从目前的研究来看,学者从不同的角度对网络编码的构造方法进行了相应的分析探讨,比如说采用的编码系数选择方式,分组编码操作方式等方面,其具体的表现是根据编码结点分组进行编码操作的方式,其中线性网络编码主要表现是结点对所接受的数据分组实行的是线性编码组合型操作,不然编码的工程就会变为非线性网络编码。我们根据编码系数的选择方式,把网络编码构造的方法分为两种,一种是确定性网络编码,另一种是随机网络编码。这两种编码都有一定的好处,但是确定性网络编码构造方法的编码系数是根据某一种算法进行确定的,而随机网络编码中编码系数是从伽罗符号中随机进行选择的,因此随机网络编码构造方法在整个的网络编码系数选择中占据着灵活性的地位,这也是随机网络编码构造方法的特点。我们根据编码在网络系统中的具体实现过程,将网络编码分为了两种编码形式,一种是集中式网络编码,另一种是分布式网络编码。集中式网络编码是在编码的过程当中需要了解全局的网络拓扑,根据全局网络的情况来分配相应的编码系数,这一编码形式并不适合拓扑变换较大的无线网络。分布式网络编码仅仅需要了解网络当中一部分拓扑信息就可以进行相应的编码操作,而且分布式网络编码还具有较为良好的应用性能。
1.3网络编码应用网络数据传送的研究
网络编码是一种编码和路由信息交换的技术,在传统道德路由方法基础上,通过对接收的多个分组进行相应的编码信息融合,以达到增加单次传输信息量的作用,从而提高网络的整体性能。网络编码最开始提出时是因为多播技术,网络编码最初是为了提高网络多播的数据速率,而随着网络研究的不断深入,使得网络编码在其他的领域也逐渐有了优势,比如说提高网络带宽的利用率,从总体而言,对网络编码的应用在很大程度上提高了网络的实际吞吐量,进一步的减少了数据分组的传输量,也在一定程度上降低了数据传送的功耗,由此我们看出网络编码为网络的数据传送性能的改善提供了新的途径。
1.4基于网络编码的数据传送技术研究趋势
随着基于网络编码的数据通信技术研究的不断深入,出现了很多新的理论,但是网络编码所面临的问题也随之增多,尤其是网络编码的网络数据传送技术问题,虽然经过近几年的研究取得了一定的进展。但是仍然面临着许多难题需要我们去逐一解决。
1)网络编码复杂度得到降低。
现阶段最主要的一个问题就是怎样在提高网络编码效率的同时降低网络编码的复杂程度。这会涉及到网络编码的相应网络开销,这也是作为网络编码性能评价的内容之一,还有就是在网络编码实用化的过程当中,逐渐控制网络编码的复杂程度,减少网络编码需要的额外的计算量,从而降低系统的实施成本。这对于网络部署以及应用网络编码都具有非常重要的意义。
2)数据传送可靠性研究。
保证网络性能的一个主要方面就是提高网络数据传送的可靠性,现阶段对网络数据传输可靠性的网络编码研究主要是根据多径路由展开的,这也在一定程度上对网络编码中的数据传输提供了可靠性。因此在多跳动态的网络环境当中,分析研究提高网络编码数据传送的可靠性具有很高的现实意义。
2基于网络编码的数据通信技术的相应解决方案
1)在对网络编码的网络协议结构研究当中
其出发点主要向三个方面集中:一是较为系统的分析网络编码在各个协议层与现有协议相结合的参数,其目的是为了让应用网络编码提高网络的系统整体性能;二是设计相应的对应网络性能指标的线性规划模型,以便求解出线性规划模型的最有设定;三是提高各个协议层之间的信息反馈机制来实现参数的实时调整。
2)在对网络编码时延约束控制的研究当中
针对数据在网络中各个结点频繁的参与编码和解码的操作,使得数据编码时延逐渐成为了网络数据传送累积时延的主体,基于此种情况,我们在网络编码的实际应用当中,提出了基于数据传送时延约束的网络编码模型,这一模型的出现在较大程度上对传送时延进行了优化的控制;与此同时我们还引入了数据传送信息反馈机制,以此来促进数据在网络结点中的及时有效传送。
篇2
目前,我国各高校的学位论文大部分都是用中文撰写的,也有一小部分是用外文撰写的。高校图书馆将学位论文收藏至自建特色数据库,就需要对学位论文进行编目,对学位论文编目时要保证编目产生的关于学位论文的数据的质量,以方便读者检索并利用学位论文。
1 中文MARC编目学位论文存在的问题
高校图书馆对文献资源进行有效的分类标引和主题标引,并用相应的著录、编目格式使文献资源的主要检索项及特点形成书目的形式就是高校图书馆的编目工作[1]。学位论文编目的工作流程一般为:回溯编目―审校―典藏―贴书标―入库上架。学位论文作为一种特殊的文献资源,其编目具有自己的特点:1)编目难度高。高校大学生研究的学术领域及学术方向繁多,其具体研究方向小而专,对非专业编目人员来说,分类编目比较困难;2)编目工作量巨大。教育事业飞速发展,各高校每年都在扩大招生,进而各高校每年产出的学位论文数量激增,而高校图书馆编目人员有限,而且图书馆每年还要有其他书目入馆需要编目,因此编目人员总的工作量非常大。3)学位论文撰写语种不统一。部分高校设有外国语学院,这些学院的部分学生所撰写的学位论文所使用的语种一般为外文。
中文MARC是以UNIMARC为基本依据,根据我国出版物的具体情况制定的[2]。中文MARC机读记录字段区有如下10个功能块:0―标识块;1―编码信息块;2―著录信息块;3―附注块;4―款目连接块;5―相关题名块;6―主题分析块;7―责任者块;8―国际使用块;9―国内使用块[3]。中文MARC通过对每个功能块增设功能不同的多种字段及子字段、对每个字段又增设不同要求的标识符的方式更为详细的记录文献信息。
高校图书馆编目学位论文最终要达到的目标是:1)精准、全面、直观的反映出学位论文所表达的科研成果,包括科研成果的领域,关键词等信息。2)准确标引学位论文,形成规范数据,方便读者进行检索。编目学位论文是读者可以使用学位论文的前提和基础,学位论文编目工作的质量直接关系到读者对学位论文的使用情
况[1]。因此,学位论文编目工作是高校图书馆工作中的一个重要分支,各高校对学位论文编目工作都很重视。但是由于学位论文本身具有的特殊性和中文MARC编目具有的高技术性,导致中文MARC在对学位论文进行编目的时候会出现一些问题,而这些问题的出现直接影响了学位论文编目的质量,进而影响到学位论文在高校图书馆乃至整个学术界的正常流通。中文MARC在高校图书馆学位论文编目中存在如下问题。
1)标准不统一。当前我国使用比较普遍的中文MARC编目标准有两种:一种是国家图书馆编写制定的全国图书馆联合编目中心系统标准;一种是北京大学图书馆编写制定的中国高等教育文献资源保障系统,即CALIS系统标准[3]。虽然采用这两种中文MARC编目标准编目的数据覆盖面都很广,共享性也比较强,但还是应该将这两种标准结合,制定一套唯一的编目标准。有了唯一的标准,各高校图书馆在选择编目系统时也不需要进行比较,既方便了高校图书馆编目工作,也能使图书信息流通更顺畅。
2)标引不规范。《中国图书分类法》是高校图书馆编目分类的主要依据。由于部分高校图书馆还有自己编写的《图书馆编目分类细则》,并结合这两个规范来进行编目,因此在很多编目细则上出现了不一致现象。
3)著录字段不完整。中文MARC编目虽然具有详细的编目规则,但是不同的编目员对规则的理解会有所不同。在中文MARC著录中,字段和指示符都有详细的规定,如果出现指示符的漏著、错著都会直接影响到学位论文的检索。
4)外文语种撰写的学位论文编目格式不统一。当前我国图书馆使用USMARC对外文图书进行著录,而有些图书馆认为只有原版外文书籍才应该用USMARC进行编目,其余外文图书应该按中文MARC格式来著录。因此,使用外文撰写的学位论文编目格式就出现了两种,即USMARC格式和中文MARC格式。这种不一致的编目格式会严重影响到学位论文的网上共享,对数字图书馆的建设也有不利影响。
高校图书馆每年进书量都很大,新进图书只有经过编目才能入库上架,读者才能在馆藏书目检索系统中检索到图书,而高校图书馆专业的编目人员非常有限,因此就会出现非专业人员对图书进行编目,比如燕山大学图书馆学位论文的编目工作就是由勤工助学的学生来完成的。编目工作对人员专业要求比较高,编目细则又非常繁杂,虽然专业的编目人员已经设定号学位论文编目格式,但是非专业人员在对学位论文进行编目的时候很容易就会出现漏著、错著的现象,而在对学位论文编目中出现的错误只有非常专业的编目人员才能及时发现,这样就会导致很多编目过程中出现的错误到最后都没有被发现,从而影响到读者对学位论文的检索。
篇3
1 引言
目前最新的视频编码标准H.264/AVC[1]是由国际电信联盟(ITU-T)的视频编码专家组(VCEG)和国际标准化组织(ISO/IEC)的运动图像专家组(MPEG)建立的联合视频工作组(JVT)联合制定的。在H.264/AVC标准中,为了获得高视频质量和高压缩比,采用率失真优化 RDO (rate distortion optimization) 模型[2,3]选择帧内预测模式,但帧内预测模式选择算法的高计算复杂度是制约H.264/AVC实际应用的主要因素之一。帧内预测模式选择的改进算法研究,成为近年来国内外研究的热点。毕业论文,H.264/AVC。现有的帧内预测模式选择优化算法,大体可分为2类:1) 简化 RDO代价函数[4];2)通过概率预测及阈值判断来减少候选模式[5-7]。其中第2类方法吸引了更多研究者的关注。然而这些方法在提高编码速度的同时,编码性能都有所下降。
本文对多种序列的帧内编码中各种预测模式所占比重进行统计,并基于统计结果提出了一种单向直接预测与多方向预测相结合的自适应算法。该算法对用于预测的参考像素进行相似度判断,在参考像素相似度高时,直接使用DC预测模式进行预测,除了能省略编码H.264/AVC中传统的9种预测模式所需要的比特,还节省了传统方法中需要进行的在9种模式之间进行择优的运算过程。从而,在提高编码性能的同时,减少了计算复杂度。
2 H.264/AVC帧内编码过程
H.264/AVC使用帧内预测编码技术以降低邻近宏块之间的空间相关性,它定义了9种4×4亮度块预测模式,4种16×16亮度块预测模式。编码端采用率失真优化模式判决方法选择最佳的帧内预测模式。本文主要针对H.264/AVC中4×4亮度块的帧内预测编码进行研究。4×4亮度的预模式除平均模式(模式2)以外,还有其它8种模式,它们具有不同的预测方向。图1显示了这8种模式的预测方向。
对于一个4×4块而言,它需要用1个或4个比特表示编码模式。在一个宏块中,共有16个4×4子块,共需要16到64个比特来表示编码模式。毕业论文,H.264/AVC。在低码率视频编码应用系统中,编码帧内预测模式所需的比特在总码流中占较大的比重。同时,遍历H.264/AVC所定义的全部预测模式,并用率失真优化函数在其中择优,需要较大的计算量。为了减少表示编码模式所需的码率,并提高编码速度,我们提出利用参考像素的相似度来决定是否直接进行平均模式的预测编码。
3 基于参考像素相似度检测的帧内预测编码
图2为4×4待预测子块及其参考像素,其中为待预测像素,为相邻块中的参考像素。从预测原理可知,当所有的参考像素都相同时,使用9种预测模式所得的预测值都相同。在这种情况下,使用这些模式进行预测所得到的残差也相同。当不完全相同但非常近似时,考虑到量化步骤会将比较相近的残差值量化为相同的值,我们也可以得出同样的结论。因此,在上述情况下,我们默认使用一种固定的预测模式进行预测,不但可以省略标识预测模式所需要的码流,还可以省略其余8种预测所进行的率失真决策计算量。
图1. 4×4亮度块的帧内预测模式图2.预测块及其参考像素
为了确定默认模式,我们选取多个CIF序列,对不同序列中各个预测模式的分布情况进行了统计分析,如表1所示。从表1可以得知,垂直、水平以及DC三种模式之和占所有预测模式的60%以上,其中DC模式占的比重最大。毕业论文,H.264/AVC。毕业论文,H.264/AVC。因此,为了适应参考像素比较相似的纹理特性,我们选择DC模式作为默认模式。
篇4
在移动通信系统中,可以通过高阶信号调制技术和多输入多输出(MIMO)技术来提高系统的频谱效率,但是,在一个噪声信道环境下,传输数据速率的提高会带来误码率的提升。为了提高频谱效率,长期演进(LTE)移动通信系统中采用了链路自适应技术,根据信道条件的变化,系统动态地采用不同的调制和编码、MIMO传输模式[1]、预编码和发射功率等技术,以期在保证信号质量的情况下取得最大的传输效率。
LTE移动通信系统采用了正交频分多址(OFDMA)、多输入多输出(MIMO)[2]等关键技术,以此来克服多径信道的频率选择性衰落和提高系统的传输速度。本文对LTE移动通信系统中预编码算法进行了研究,并根据信道条件的变化,对链路自适应调制与编码技术下的预编码算法进行了性能仿真,分析了不同调制与编码下系统的传输速率与误码率的曲线变化。
二、基于信道矩阵奇异值分解的预编码算法
多输入多输出(MIMO)技术将连续的信号比特流拆分成多个信号子流,再将各信号子流通过不同的天线发射出去,传输各信号子流的多个发射天线与接收天线构成了空间信道矩阵。在空间信道矩阵构成的各子信道不相互独立的情况下,各子信道将相互干扰,从而影响信号接收质量。在LTE系统中,预编码技术被看作是解决空间各子信道相互干扰最有效的方法[3]。最优的预编码矩阵是基于信道矩阵奇异值分解的矩阵。
首先假设在一个子帧持续时间内,信道矩阵H不变,假设系统有NT根发射天线,MR根接收天线,发射符号分为L层,每个层有T个符号,第i层由符号[xi,1,xi,2,...,xi,T]组成。对信道矩阵H进行奇异值分解:
式中,n为高斯白噪声。在实际的应用中,由于反馈资源的限制,系统首先须在预先给定好的码本里选择一个码本作为预编码矩阵,也就是利用某种准则得到码本索引。
三、预编码矩阵下的MIMO接收机算法
LTE系统中的预编码矩阵指示(PMI)反馈都是基于协议配置码本,主要有两种准则:一种是基于系统容量最大化,另一种是基于最小误码率(BER)[4]。本论文采用基于最小误码率的MMSE准则,减小发射信号和接收信号之间的误差信号功率值,并以此自适应选择不同的调制方式和编码,以便保证系统取得最大的传输容量。假设均衡后的信号为X?,最初的发射信号为X,假定最优均衡器变换系数为G,MIMO信道矩阵为H,那么误差信号可以表示为:
四、自适应调制与编码技术下的预编码算法仿真实验
为了对算法性能作对比,在预编码算法基础上,自适应调制方式分别在QPSK、16QAM、64QAM三种方式进行选择,接收端用MMSE准则的均衡器,将发射信号功率值与均衡后的误差信号功率值的比值作为自适应调节参数,选择相应的调制方式与编码率,当误差信号功率值较大时,此时误码率较大,选择低阶调制方式,以保证信号传输质量,当误差信号功率值较小时,选择高阶调制方式,以提高信号的传输速率,以期在满足信号质量要求的情况下达到最高的传输效率。
仿真实验在多输入多输出MIMO的情况下展开,信号经过衰落噪声信道,信噪比SNR取值在0dB到21dB之间,信噪比与误比特率和数据传输速率仿真结果分如图1、2所示。
从图1可以看出,随着SNR的值增大,误比特变小,采用固定调制的阶数越高,误码率越大。在信噪比的值为0dB到12dB之间时,固定64QAM、16QAM高阶调制的误码率都较高,但是,在自适应调制和编码方式下,误码率却随着信噪比变大很快变低,因为链路根据误差信号功率情况自适应地选择了恰当的调制方式和编码率。从图2可以看出,在其他参数不变的情况下,采用固定调制方式和编码率时,数据的传输速率是一个定值,调制阶数越高,数据传输速率越大。但在自适应调制和编码方式下,链路根据信噪比情况,灵活改变了数据传输速率,信噪比的值越小,误比特率就变高,此时数据传输速率减小,信噪比的值越高,误比特率就变小,此时数据传输速率增大,在满足信号质量要求的情况下达到了非常高的传输效率。
五、结论
论文对链路自适应调制与编码技术下的预编码算法进行了研究,在LTE系统中,预编码技术被看作是解决空间各子信道相互干扰最有效的方法。论文采用基于信道矩阵奇异值分解的方法得到最优的预编码矩阵,信号经过噪声信道后,在接收端,采用基于最小误码率的MIMO接收机算法,减小发射信号和接收信号之间的误差信号功率值,以此自适应选择不同的调制方式和编码,以便保证系统取得最大的传输容量。通过仿真验证,在预编码算法基础上,采用自适应的调制和编码方式能根据信噪比大小变化,灵活改变数据传输速率,在满足信号质量要求的情况下达到了非常高的传输效率。
参 考 文 献
[1] V Stankovic, M Haardt, Generalized Design of Multi-User MIMO Precoding Matrices [J].Wireless Communications, IEEE Transactions, 2008, 7(3):953-961.
篇5
以数字视频的采集、压缩、处理为核心的现代视频监控技术,采用先进图像处理芯片对视频进行压缩处理,把智能图像处理技术用于图像显示、监控成为嵌入式视频监控系统的重点研究方向[1]。无论是MPEG1、MPEG2或者是MPEG4、H.263都已经无法满足运动图像压缩的要求,这时新一代的H.264标准便被制定,H.264作为新一代的编码方式,有效提升了视频压缩率,仅需原先的一半带宽即可播放相同质量的视频,而且视频编码的码率更加灵活,架构主要包括,帧内预测、帧间预测、转换、量化、去区块滤波器、熵编码等模块,下面将研究H.264视频编码的关键技术及其应用前景。[2]
1 H.264压缩标准
H.264是两个组织专家ITU-T和ISO为多媒体传输设计的数字视频编码标准[3],全称是MPEG-4AVC,翻译成中文意思是“活动图像专家组-4的高等视频编码”,或称为MPEG-4Part10。各种分辨率的视频图像格式都可以被H.264视频编码标准支持,包括sub-QCIF、QCIF、CIF、4CIF、16CIF等[4]。H.264是一种视频压缩标准,同时也是一种被广泛使用的高精度视频的录制、压缩和格式。H.264比其他编码标准有着更高的视频质量和更低的码率,被广泛用于网络流媒体数据、各种高清晰度电视陆地广播以及卫星电视广播等领域。H.264的特点是能低码率、高清晰持续提供较高的视频质量,能大大加强图像的编码效率和改善图像数据在网络中的传输效率。[1],使网络更加灵活、适应性更强,最大的好处就是节约了成本,弥补了技术差距,让存储与视频管理变得更高效。
2 H.264编码器的结构和特点
H.264只是规定了输入码流的格式及编码之后输出比特流的句法结构,其标准的编码思路是混合编码模式,以帧间和帧内预测来清除空间和时间的冗余分量,用变换和量化编码来清除频域冗余分量。H.264视频编码在一定情况下提高了视频压缩编码性,其视频解码与编码实现的过程相反,依据帧内编码进行逆量化,反变换,重构帧,最后经块滤波器平滑滤波后得到重建图像,[1]H.264编码器的功能组成框图如1。
3 H.264编码器关键环节分析
3.1 帧内预测 比起H.263,H.264提供了更多不同的工具来降低码率,以编码单位来说,h.264中每个宏块(macroblock/mb)大小都是固定的16×16像素,能够实现高分辨率视频的压缩,对于帧间编码来说,它允许变换块的大小根据运动补偿块的大小进行自适应的调整;对于帧内编码来说,它允许变换块的大小根据帧内预测残差的特性进行自适应的调整。
3.2 帧间预测 H.264标准与早期标准不同之处在于,它所使用的是块结构运动补偿,运算精度精确到1/4像素点上。[8]不仅如此,H.264标准还使用了多帧预测的方法,能够明显改善预测增益。[5]
3.3 整数变换与量化 H.264中整型变换与之前的MPEG系列标准所采用的DCT变换都有区别:
①它是整形变换(所有的操作都为整数运算,不存在解码精度损失)。②用整数算术变换可以确保编解码之间实现零失配。③变换的核心运算部分只用到加法和移位运算,不需要乘除运算。④到量化器的缩放乘积因子为整数,减少了乘积因子的数据位数。[4]量化的目的是减小信号的值域,以更少的比特来表示信号,从而达到减少数据量的目的。H.264中量化的步长总共有52种,其按照12.5%递增,并且变换系数的读取有双扫描和之字形两种方式。
3.4 熵编码 熵编码是对数据的冗余信息进行压缩的方法,变长编码和Huffman编码相结合进行,以较短的字长表示出现概率较大的数据,较长的字长表示出现概率较小的数据来达到降低数据量的目的。
CAVLC是一种变长编码。先对变换系数进行zig-zag扫描。用行程码(L,V)表示扫描以后的数据,V代表数值,L代表该数出现的次数。因为视频块在整形变换和量化后,大部分变换系数成为0,只有很少的数据在低频部分,用行程数L代表连续出现的0的个数,V代表0串后挨着的非零值,接着对L和V分别采用Huffman编码进一步压缩,有不同的码表可以查询亮度块和色度块。行程编码大大降低了编码的码字字长。CABAC是一种二进制算术编码,其通过构建模型来预测当前的视频信号。相对于CAVLC编码,CABAC的编码效率更高,更节省码率。[4]
3.5 码率控制 H.264视频编码标准虽然对于编码器的结构实现模式没有具体的规定,但编码器实现的核心问题要解决编码器的结构、相应的视频编码如何控制。H.264编码器采用基于拉各朗日Lagrangian优化算法的率失真优化模型实现视频编码的控制,其实现方法简单而且效率高。[5]
H.264编码标准由于以上关键技术的支持,获得了较高性能编码,但编码器复杂度增加,约为MPEG2的4倍,MPEG4的2倍。其高复杂度原因有两个方面,一是编码选项复杂,二是计算量高。具体内容有宏块的划分及搜索模式的组合的选取、高精度亚像素运动补偿和多参考顿预测,H.264更细化,更精确的数据压缩导致了计算量高。[6]
4 应用前景
H.264作为一种具有高效压缩性能的视频压缩编码技术,其在制定的过程中就充分参考和吸收了H系列和MPEG系列的优秀研究成果,修改或重新制定了其中不合理的部分,使其有很好的压缩性能。H.264能够比H.263和MPEG-4大约省去50%的码率。[7]H.264的高效的视频压缩能力和优异的网络适应性,为视频数据传输的可靠性提供了保障,其可广泛应用于数字摄像、英特网、数字视频录像、DVD及电视广播等领域的图像压缩。
5 结束语
网络视频监控系统要达到良好的监控效果,仅提高摄像头的分辨率是不行的,只有通过改善数字视频的压缩技术,降低视频传输的误码率,提高视频的质量,才能推动网络视频走向智能化。[1]H.264标准的推出是视频编码标准的一次重要的进步,尽管其算法复杂,但是能够大幅度提高编码效率,使得应用范围更加的广泛。
参考文献:
[1]李红京.基于H.264视频压缩技术的网络视频传输系统设计[J].河北工业科技,2011,28(4):236-239.
[2]齐淋淋,向健勇,唐巍.H.264视频压缩关键技术及其应用前景[J].电子科技,2005(10)13-16.
[3]党晓军,尹俊文.基于H264的嵌入式视频监控系统研究[J].计算机技术与应用进展,2008:407-412.
[4]刘继红,孙海龙,屈鹏.TD-MBMS中H.264视频压缩的实现过程[J].信息通信,2008,4:14-16.
[5]牛建民.H.264视频压缩算法应用研究[M].同济大学工程硕士学位论文,2007,5.
篇6
WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、WAVELET影像压缩简介及基础理论介绍
一、WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、影像压缩过程
原始图形资料色彩模式转换DCT转换量化器编码器编码结束
三、编码的基本要素有三点
(一)一种压缩/还原的转换可表现在影像上的。
(二)其转换的系数是可以量化的。
(三)其量化的系数是可以用函数编码的。
四、现有WAVELET影像压缩工具主要的部份
(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。
(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种本论文由整理提供
为内插。
(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffatslineartimecodinghistogram的基础上。
(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、WAVELET影像压缩未来的发展趋势
一、在其结构上加强完备性。
二、修改程式,使其可以处理不同模式比率的影像。
三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、加强运算的能力,使其可支援更多的影像格式。
五、使用WAVELET转换藉由消除高频率资料增加速率。
六、增加多种的WAVELET。如:离散、零元树等。
七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、增加8X8格的DCT模式,使其能做JPEG的压缩。
九、增加8X8格的DCT模式,使其能重叠。
十、增加trelliscoding。
十一、增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、影像压缩研究的方向
1.输入装置如何捕捉真实的影像而将其数位化。
2.如何将数位化的影像资料转换成利於编码的资料型态。
3.如何控制解码影像的品质。
4.如何选择适当的编码法。
5.人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。
7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。
附录:
嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送
目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。
阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。
基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术本论文由整理提供
使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。
LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。
LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。
所以将LEZW技术延伸至渐进式传送,在编码之前可以先设定每一级(Stage)的解析度与传送每一级所累加的码率(AccumulatedRate),然後再编码与传送之。该系统在低码率时用低解析度来显示影像,在较高码率时则以高解析度来显示影像,将改善渐进式传送的视觉品质。此系统在编码传送的过程中,允许传送的位元流在任一点位置被中断停止,而接收端可以由所接收到的资料,将影像重建在资料中断时的解析度下。
篇7
专论、综述、研究论文、研究简报、前言动态、信息交流。
投稿须知
1.文稿要求。来稿要求内容充实、立意创新。写作上要重点突出,条理分明,论据充分,数据可靠,文字简练。书写要工整,用字要规范,标点要正确,计量单位和符号要符合国家标准。外文字母、数学符号、拉丁学名要分清大、小写,正、斜体;上、下角的字母、数码和符号,其位置也应标示清楚。为便于快速处理稿件,来稿须一式两份(一份可以是复印件),以便同时送审,稿件请用5号宋体1.5倍行距打印在A4纸上,写明排版软件,并附相应磁盘。推荐使用电子邮件或网站稿件远程处理系统投稿。
2.文稿内容。来稿须包括:中文题目,作者姓名,单位、地址、邮政编码,摘要、关键词;英文题目,作者英文姓名,单位、地址、邮政编码,英文摘要Abstract、关键词Keywords;正文部分;致谢;参考文献。正文部分区分综述专论、研究论文和简报,对内容和格式要求有所差别。综述专论须包括:引言、展开论述部分、结论及展望。研究论文和简报须包括:引言、材料与方法、结果与分析、讨论四部分。文章篇幅,综述专论和研究论文通常不超过5个页码,约8000字;研究简报不超过3个页码,约5000字。
2.1标题。文章标题务求简明扼要,以反映论文主题,一般不超过20字,避免使用副标题,避免在标题中出现缩略语、字符、代号和公式等。英文标题与中文相吻合,除连词、介词及冠词外,词的首字母大写。正文中各级标题应精炼明确,以不超过15字为宜。用阿拉伯数字连续编号,可用至3级标题,不同级别的数字之间用实心圆点“.”相隔,最末数字不加标点,如:“2”“2.1”“2.1.1”,以此类推,一律左顶格,后空一字距写标题。正文引言部分不立标题,不加编号。
2.2作者与单位。文章作者的署名人数及顺序由作者自定,但要求文稿无知识产权争议问题,所有署名作者对文稿署名认可。多位作者的署名之间用逗号隔开,并分别注明所有作者的单位、城市和邮政编码。
2.3摘要与关键词。正文前须有200~300字摘要,包括目的、方法、结果和结论,能够简明确切地反映论文的主要信息,并重点提示出论文的创新之处。英文摘要应与中文摘要一致。在中、英文摘要下方分别列出中、英文一致的关键词3~8个。
2.4脚注。来稿首页注脚处注明论文资助的基金项目和作者简介(第一作者或/和通讯作者)。基金项目包括课题来源、名称及基金代号;作者简介包括姓名、出生年份、性别、籍贯、民族(汉族可略)、职称、学位、所从事专业方向及联系方式(包括电话、E-mail)。
2.5图与表。文中图与表一般不超过3~5个,且精炼、完整;图表的题、项、注等要求英汉双解;表格一律采用三线表。在文字中概括归纳图表内容时,避免逐项重述数据及图表的重复使用。图表的标题、内容及注解一律用中英文对照标示。请作者同时提供图片的原始文件,以保证图片的清晰。
2.6参考文献。参考文献只列入近期的、主要的、已公开出版的引用文献;按在论文中出现的顺序挂角于文末;内容、书写顺序应规范;一般不超过30个。参考文献的著作者少于3人时全部列出,超过3人时,只列前3人,后加“等”字(英文为“etal.”)。主要文献的书写格式如下:
书:[序号]著者.书名.版次(第1版不标注),出版地:出版者,出版年.起-止页码
期刊:[序号]著者.文章名.期刊名(英文刊名可缩略),出版年,卷(期):起-止页码
会议录、论文集等:[序号]著者.文章名.见(In):编者名.文集名.会议名,会址,开会年,出版地:出版者,出版年.起-止页码
专利:[序号]专利持有者.专利名称.专利国别,专利号
篇8
1、引言
H.264是一种高性能的视频编解码技术, 它是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。论文写作,整像素预测。
作为新一代的视频编码标准,它具有很高的数据压缩比率和优异的性能,广泛应用于视频会议、视频点播、高清视频、移动播放器等多个领域。
H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。论文写作,整像素预测。和MPEG-2和MPEG-4ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。论文写作,整像素预测。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。
在H.264的编码芯片结构中,相比帧内,帧间(Inter Prediction)编码的效率高,但是运算复杂度也比较高。帧间编码的核心运算部分是“ME”(motion estimation)即运动估计,占用最多的逻辑与时钟资源。帧间预测的运动估计过程分为整像素运动估计(IME)和分像素运动估计(FME),首先找到整像素的最佳MV,然后再进行分像素的搜索。除了巨大的计算复杂度,编码过程也很长,包括预测,重构和熵编码。
2、运动估计运算
H.264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。由于引入了1/4像素精度、多种分割预测等先进技术,在获得更高压缩率的同时,其算法复杂度也大大提高,使得帧间预测编码耗时占到整个编码计算时间的50%以上,若采用全软件实现高清图像的实时编解码,明显力不从心,这就要求使用高性能的硬件编解码器来完成高清实时编解码任务,这也是本人研究的主要内容。
编码宏块(16x16象素)可以分割成不同大小的块像数据,例如16x16、16x8、8x16、8x8、8x4、4x8、4x4等七种模式。而“ME”的再对各种宏块分割方式下的每个块象素进行预测运算,然后由后续模块统计和比较出最优的分割方式。
运动估计包括整像素预测(IME)和分像素预测(IME)两部分,这两部分是串行的。每一个宏块,只有在IME 做完之后,找到最佳整像素MV,再进行FME。
在进行IME计算时,首先要计算MVP,对于一个块象素,预测运算就是在参考帧中搜索出最佳匹配(即两者差异最小)的同尺寸块象素作为当前块的参考区域。如果在整个参考帧的范围下进行全面的搜索,固然可以得到最为匹配的区域,但是复杂度太大。事实上,相邻块在参考帧中的匹配区域一般位置比较接近。综合考虑算法复杂度,编码效果,资源使用等方面,帧间预测做了如下处理:首先根据周边块的Mv值预测出当前块的Mv值,即Mvp,然后在Mvp所指参考帧中象素点周边搜索最佳块象素。
MVP的搜索过程如图2所示,假定E为当前的宏块、宏块分割或者亚宏块分割,除了16x8和8x16,MVP为A、B、C的MV的中值;对于16x8分割,上面部分MVP由A预测,下面部分MVP由B预测;对于8x16分割,左面部分MVP由B预测,右面部分MVP由C预测。论文写作,整像素预测。以MVP作为搜索的起点。
图2 MVP 计算
IME在进行当前宏块MB(x)的MVP计算的时候,前面的宏块MB(x-1)包含分像素的MV还未得到,这个时候我们无法得到准确的A,所以我们此时以MB(x-1)的16x16分割搜索时所得到的整像素MV来代替A,并把据此计算得到的MVP作为搜索的起点。
3、IME模块及功能
IME模块的架构如下图所示
图3 IME模块架构图
IME的主要功能是:
(1)数据:把原始和参考YUV从inter_config模块中取出,为PS和FME模块准备预测所需数据;
(2)控制:控制帧间预测的过程
IME的模块划分及各自功能:
Pipe_ctrl:不同分割间的搜索和选择 将不同分割方式的顺序搜索改为并行,用两条水线来实现加速 Pipe0:进行P16x16,P8x16,P4x8 ;Pipe1:进行P8x8,P16x8,P8x4,4x4由两条共同完成(为了减少pipe0的等待时间,把pipe1的部分工作放到pipe0中)
MVp_ctrl:每种分割的具体搜索过程
(1)计算MVp值
(2)控制reg_ctrl模块的数据存取
Reg_ctrl:为相连模块准备数据
(1)为整像素准备数据,传输给PS模块;
(2)为分像素搜索准备数据,传输给FME模块;
(3)为重构准备数据,传输给FME模块
4、与IME模块相关的主要功能模块
图3中与IME工作相关的有两个主要的部分,一个是Inter_config 模块,还有一个是PS模块,它们在系统中起着重要的作用。论文写作,整像素预测。
1. Inter_config模块及功能描述
Inter_config模块,即帧间数据调度模块,其数据传送如图4所示,Inter_config模块有两部分功能:一是为IME服务,把IME所需的数据从DDR取到Sram;二是为Loop Filter服务,把LoopFilter模块的deblock运算所需要的一部分数据从DDR取到Sram以及将deblock运算后的宏块数据存入DDR。
图4 Inter_config模块数据传送
Inter_config模块与IME有关的工作包括:
1)取原始YUV数据,Luma部分直接拉给IME_Reg_o,Chroma部分存入Sram0。
2)为IME准备计算所需的9个宏块的Luma数据,并存入Sram0和Sram1。
3)将这9个宏块的Chroma数据准备到Sram1中,用于Chroma资料拼接之用。
4)接收到IME_ChromaStart_i信号有效后,开始FME运算所需Chroma数据的相关准备工作。包括:①从Sram0中取Chroma的原始YUV送给IME;②从Sram0中取Chroma3x3Mb数据并进行拼接(将每个block对应的2x2像素,向右向下扩展,变成3x3像素)后送给IME。论文写作,整像素预测。
5)把最后一行的5个mv(当前Mb最后一行的block的4个mv及右侧相邻的1个mv)存入Sram0,作为下一宏块行进行Mvp预测所需数据。
2. PS模块功能描述
PS模块,即预测选择模块,本模块主要用于选择当前编码宏块的最佳预测方式,帧内预测还是帧间预测;若是帧间预测还需给出宏块的最佳分割以及分割的最佳MV,除此之外,还需求残差值,用于后面的重建。其主要功能如下:
1)接收IME模块的整像素亮度值,以进行整像素搜索,找出最佳的整像素MV;
2)将两套流水线所得出的cost进行比较,选出最佳partition;
3)接收inter_ctrl模块中IME模块的亚像素亮度值,以进行亚像素搜索,找出最佳的亚像素MV以及cost,并与最佳的整像素MV的cost相比较,选择最佳的MV;
4)将选出的最佳的cost与intra_ctrl中的最佳的cost,比较得出最佳的预测方式,帧间还是帧内;
5)若选出的是帧内,则结束当前宏块的帧间操作,准备下一个宏块的帧间操作;若选出的是帧间,则接收IME或FME的亮度和色度值,进行求残差操作,送给DCT以备后面重建。
5、总结及展望
本文对帧间编码中IME运算所需数据进行探讨和分析,并提出一套架构设计方案,时序和资源使用都比较优化。设计方案在空间上具有较高的并行度,处理能力高,非常适合实现高清视频编码。目前市场上对于H.264的研究开发一般都是基于PC或者DSP解决,很少有基于硬件实现的开发,功能上还不足以实现高清实时信号的编码和解码。本设计能够实现帧间预测的关键部分,在后续的研究中如果能使用H.264标准在帧间预测所带来的高压缩率,如果能将其带来的复杂度的增加限制在可容忍的范围内,支持帧间预测的高清实时视频编解码的芯片实现是非常有意义的,应用前景很广阔。
参考文献
[1]新一代视频压缩编码标准——H.264/AVC 毕厚杰 人民邮电出版社
[2]Iain E.G.Richardson.H.264 and MPEG-4 Video Compression: VideoCoding for Next Generation Multimedia. U.S: Wiley Press, 2003.
[3]Tung-Chien Chen, Chung-JrLian, and Liang-Gee Chen. Hardware Architecture Design of an H.264/AVC VideoCodec. Asia and South Pacific Conference on. Design Automation, 2006.
篇9
(二)关键词:是反映文章最主要内容的术语词,每篇文章选3-8组为宜。
(三)作者简介:包括姓名(出生年)、性别、民族、籍贯、职称、研究方向、工作单位、地址、邮编、电话及电子信箱。
(四)文章题目、作者单位、摘要及关键词均应译出英文,著者姓名标出汉语拼音。
(五)参考文献:指著者引文(正式出版物)所注的出处,文中用方括号按先后顺序标出,且置于行文的右上角,文献说明一律放在文末,即采用顺序编码制。外文参考文献按照国际通行的著录格式标注。 其格式如下:
1.著作:[序号] 主要责任者. 文献题名 [M]. 出版地:出版社, 出版年. 起止页码(任选).
[1]孙汉超.体育管理学教程[M]. 北京:人民体育出版社,1996. 178-180.
2.译著:[序号]国名或地区(用圆括号)主要责任者.文献题名[M].译者. 出版地: 出版社,出版年. 起止页码(任选).
[1]乔治·迪特曼.提高速度的秘诀[M].段金译.长沙:湖南文艺出版社,2002.151.
3.论文集:[序号] 主要责任者. 文献题名 [C]. 出版地:出版社, 出版年. 起止页码(任选).
[1]辛希孟. 信息技术与信息服务国际研讨会论文集:A集[C]. 北京: 中国社会科学出版社, 1994.
4.论文集中的析出文献:[序号]析出文献主要责任者. 析出文献题名 [A]. 原文献主要责任者(任选).原文献题名[C].出版地: 出版社, 出版年. 析出文献起止页码.
[1]钟文发. 非线性规划在可燃毒物配置中的应用[A]. 赵玮. 运筹学的理论与应用——中国运筹学会第五届大会论文集[C]. 西安:西安电子科技大学出版社,1996. 468-471.
5.期刊文章:[序号] 主要责任者. 文献题名 [J]. 刊名,年,卷(期): 起止页码(任选).
[1]万晓红,欧阳柳青,杨梅,等. 试论奥林匹克运动会的社会功能及人文价值[J]. 武汉体育学院学报, 2003, 37(3): 4-6.
6.报纸文章:[序号] 主要责任者. 文献题名 [N].报纸名,出版日期(版次).
[1] 孙浩. 肥胖已成全球问题[N]. 健康报,2004-05-18(5).
7.电子文献:[序号] 主要责任者. 电子文献题名 [EB/OL].文献出处或可获得地址,发表或更新日期/引用日期(任选).
[1]华栏,包建. 心理养生——21世纪健康主题 [EB/OL]. dzjk.com. 2004-03-20.
参考文献类型标识 参考文献类型 专著 论文集 报纸文章 期刊文章 学位论
文 报告 标准 专利
文献类型标
识 M C N J D R S P
二、省(部)级以上立项的课题(项目),请注明项目名称与编号,并附上复印件。
三、本刊实行匿名审稿制度,凡“作者简介”信息一律另页列出。
四、本刊对决定采用的文稿,会通知作者再给本刊寄发电子版。敬请合作,谨表谢意。
中文版论文格式:
标题(居中,小二黑体)
作者姓名1,作者姓名2,作者姓名3(小四号宋)
作者单位, (邮政编码)(五号仿宋)
作者单位, (邮政编码)(五号仿宋)
作者单位, (邮政编码)(五号仿宋)
E-mail(小五,Times New Roman)
摘 要:本文给出了一种„(五号,楷体)页边距: 左右各:3.17cm, 上下各:3.5cm;页眉:2.8cm, 页脚3.0cm。 关键词:(3-5个)
1. 引 言(四号,宋体,加粗)
近年来。。。(正文五号宋体,段首空两汉字字符,1.25倍行距)页边距: 左右各:3.17cm, 上下各:3.5cm;页眉:2.8cm, 页脚:3.0cm。
2. 系统介绍(同上)
2.1 一级子标题(小四号,宋体,加粗) 2.1.1 二级子标题(五号,宋体,加粗) 3. 。。。。。。 4. 。。。。。。 5. 结论(同上)
本文给出了。。。
篇10
投稿要求:
1.本刊实行无纸化办公,不接收打印稿,投稿请通过电子邮件发送。
2.文稿应具科学性、逻辑性,并有理论和实践意义。来稿文字务求准确、精练、通顺、重点突出;公式或代号要分清上、下
角标,计量单位采用国际计量标准。表格、图形清晰明了。
3.来稿请写清标题、作者姓名、作者单位(全称)、作者简介、联系方式(含电话、电子邮箱、通信地址与邮政编码),第一
作者身份证号码(发放稿费需要)。
4. 稿件写作要求如下:
文章题目一般不超过20字。署名作者应为对论文主题研究及撰写做出主要贡献,能够负责答辩的人员。作者单位应标注支持完成研究工作并对研究内容承担责任的单位,同时写明其所在省市(县)名称和邮政编码;作者姓名右上角和单位名称前应用数字角码标明相互对应关系。
“摘要”应概述研究的目的、材料、方法、结果和主要结论。“关键词”应选用能反映文章特征内容,较为通用的规范性词汇。
内文的格式,请参照本刊近期发表的文章。前言应概述研究背景和本研究的目的。“材料与方法”应写明试验材料、时间、地点、重复次数、取样数量、方法。“结果与分析”应简明扼要,层次分明,试验数据须进行必要的统计分析。“讨论”应结合前人的工作着重论述本文的创新点,避免太远的推论。
文中一级标题序号用1,二级用1.1,三级用1.1.1,均靠左侧顶格书写。拉丁文生物学名的属、种名为斜体,定名人为正体,属名在文中首次出现时不缩写。数字一般用阿拉伯数字。
表格采用三线表形式。线条图须用计算机作图,且该图形文件可在Word文件中打开并可编辑,若Excel作图须带数据源。照片插图需插入文稿中相应位置(复印件即可),并单独提供图片电子文件或原版照片。表题、表头、栏目、表注、横纵坐标说明、图例、图版说明等要齐全。
参考文献的著录格式,采用顺序编码制,即应按文中引用的先后顺序编号,并在文后按同一顺序依次列出。常用参考文献格式如下:
期刊:[序号]作者. 篇名[J]. 期刊名,年份,卷(期):起止页.
专著:[序号]作者. 书名[M]. 版次(1版不写). 出版地:出版者,出版年:起止页.
论文集:[序号]作者. 篇名[C]. // 主编. 论文集名. 出版地:出版者,出版年:起止页.
学位论文:[序号]作者. 篇名[D]. 保存地点:保存单位,年份.
参考文献作者不超过3人的全部写出,超过3人的只写前3名,后加“,等”或“,et al”;英美德俄等国人名书写时,应姓前名后,名用缩写。
5.来稿文责自负。本刊可对来稿做文字修改、删节,凡不愿修改的,请投稿时作特别说明。
篇11
1.来稿要求论点明确、数据可靠、逻辑严密、文字精炼,每篇论文必须包括题目、作者姓名、作者单位、单位所在地及邮政编码、摘要和关键词、正文、参考文献和第一作者及通讯作者简介(包括姓名、性别、职称、出生年月、所获学位、目前主要从事的工作和研究方向),并请在文稿的首页地脚处注明论文属何项目、何基金(编号)资助,没有的不注明。
2.论文摘要尽量写成报道性文摘,包括目的、方法、结果、结论4方面内容(100字左右),应具有独立性与自含性,关键词选择贴近文义的规范性单词或组合词(3~5个)。
3.文稿篇幅(含图表)一般不超过4000字,一个版面2400字内。文中量和单位的使用请参照中华人民共和国法定计量单位最新标准。外文字符必须分清大、小写,正、斜体,黑、白体,上下角标应区别明显.
4.文中的图、表应有自明性。图片不超过2幅,图像要清晰,层次要分明。
5.参考文献的著录格式采用顺序编码制,请按文中出现的先后顺序编号。所引文献必须是作者直接阅读参考过的、最主要的、公开出版的文献。未公开发表的、且很有必要引用的,请采用脚注方式标明,参考文献不少于3条。
来稿特别约定
1来稿勿一稿多投,收到稿件之后,7个工作日内共同审稿,电子邮件回复作者。重点稿件将送同行专家审阅。如果10日内没有收到拟用稿通知(特别需要者可寄送纸质录用通知),则请与我们联系确认。
2.来稿文责自负。所有作者应对稿件内容和署名无异议,稿件内容不得抄袭或重复发表。对来稿有权作技术性和文字性修改,作者需要安排版面数,出刊日期,是否加急等情况,请在邮件投稿时作特别说明
3.请作者自留备份稿,不退稿。
篇12
0、引言
H.264/AVC是由联合视频专家组JVT(Joint Video Team)于2003年5月正式批准的新一代视频编码标准[1、2]。论文指南。与以往的标准相比较,H.264具有压缩效率高、网络适应性好和适用于交互和非交互的应用环境的显著特点,现在得到了广泛应用,并处于不断的改进中。
H.264/AVC采用一项重要新技术:基于空间域的帧内预测,它充分利用了图像的空间相关性,根据已解码的相邻块的信息来预测当前块的信息,来提高编码性能。H.264/AVC在RDO(RateDistortion Optimization)模式下进行帧内预测模式选择,用最少的比特率获得了最好的编码效果,但由于H.264/AVC支持的帧内预测模式很多,为了确定一个宏块(Macroblock,MB)的帧内预测模式,需要计算592种组合模式的率失真代价(RD_Cost),其运算量占整个模式选择的60%左右,从而使编码器的复杂度很高。在实际编码结果中Intra_4×4模式会占据编码模式中的大部分,因此对RDO模式下4×4子块的研究非常有必要,对研究快速帧内预测算法具有重要的应用价值。
1、H.264/AVC帧内预测模式
H.264/AVC支持三类帧内预测:一、Intra_4×4是针对4×4亮度块的预测,有9种预测模式,其中包括DC预测模式(即均值预测模式)和8种具有一定方向性的预测模式;二、Intra_16×16是针对16×16亮度块的预测,有4种预测模式;三、Intra_8×8是针对8×8色度块的预测,有4种预测模式,预测模式和Intra_16×16一样,只是模式编号不一样。其中Intra_4×4模式由于块尺寸较小,适用于编码细节丰富的图像,且能获得较小的差值,但同时因其模式数目较多成为帧内编码的一个瓶颈。论文指南。Intra_16×16模式则比较适用于图像平坦区域的预测。
(a)(b)
图1 帧内预测模式方向
2、帧内4×4块预测的分析
2.1相邻块之间的相关性
在编码时,只需对预测值与实际值的差值进行编码即可,则充分利用帧内相邻宏块间的信息相关性来得到预测值,即是通过当前块编解码后的重建过程为紧邻的下一宏块提供预测值。具体到本文的4×4块,相邻的4×4块的预测模式之间具有很强的相关性,根据当前4×4块的左边块和上边块的预测模式可以预测当前块的最可能模式(MPM,Most Probable Mode)。利用该相关性可以减少预测模式的选择数目,从而可以减少编码的比特数。
2.2RDO下全搜索(FS)的帧内预测模式选择过程
具体的帧内模式选择过程[3]如下:
(1)分别计算9种Intra_4×4模式的率失真代价(RD_Cost) ,选择具有最小代价的模式。代价函数RD_Cost = SSD +λmode×Rate,其中SSD(Sum of SquaredDifference)表示当前块与重建块之间的差值平方和;λmode = 0.85×2(QP - 12) /3 (QP为块的量化参数);Rate表示熵编码后的码率。论文指南。
(2)把16个4×4块最小的RD_Cost相加得到当前宏块Intra_4×4的RD_Cost。
(3)按类似方法分别计算4种Intra_16×16模式的SAD(Sum of Absolute Difference),选择具有最小SAD的模式。计算该模式下的RD_Cost,得到当前宏块Intra_16×16方式下的RD_Cost。
(4)比较前两步获得的RD_Cost,选择具有最小RD_Cost的模式作为该宏块的帧内预测模式。
(5)Intra_8×8色度宏块的预测方法与亮度类似。
2.3 减小帧内预测复杂度的常用方法
为了减小帧内预测的复杂度,一般有两种方法:(1)简化代价函数;(2)缩小预测模式选择的范围。此方法可以利用当前块及其周围像素的某些特征,预先排除某些可能性很小的预测模式,或提前终止某些可能性小的模式的代价计算,从而降低帧内预测的复杂度。PAN Feng等利用子块边缘的变化方向从预选模式中选取最有可能的预测方向,算法中采用边缘梯度直方图的方法在几种最有可能的预测方向中选取最佳预测方向[4];Meng Bojun等提出EIPMS算法,利用代价函数和多阈值的方法提高了4×4的子块的编码速度[5];文献[6]利用下采样方法,用RD模型替代率失真方法选择预测模式;这些算法虽然大幅度降低了复杂度,但是因实现起来较麻烦、编码性能有一定的损失或是图像质量下降等问题,需要进一步的改进。
3、Intra_4×4模式选择的快速算法
本文提出的模式选择快速算法是基于上述所提到的两种方法。在SAD(Sum of Absolution Difference)代价函数模型下,可以通过图像亚采样等方法,以代价函数的局部计算为手段达到目的。并利用当前块及其相邻像素的某些特征,预先排除某些可能性很小的预测模式,达到降低算法复杂度的目的。
3.1 SAD/SATD代价函数
通过计算公式(3-1),选择值最小的所对应的模式为最佳模式。
Cost=SA(T)D+4R×λ(QP) (3-1)
其中,λ(QP)是关于QP的指数函数,4R是对使用某种预测模式后形成比特数的估计,R根据当前模式是否为最有可能的模式取值为0或1。SAD为原始图象象素和编码重建图象象素的绝对值差的和。为了更加准确的计算Cost值,通常将原始图象象素和重建图象象素的差值进行Hadamard变换,将其转换到变换域。
由于SATD与率失真(RD)性能有很强的相关性,所以利用SATD作为判断准则,预先排除掉一些可能性小的预测模式降低复杂度。相邻的4×4块的预测模式之间具有很强的相关性,相邻块的关系如图2所示,其中D是当前的4×4亮度块,A、B和C分别为左上、上边和左边的4×4亮度块。可以根据它们的预测模式确定当前4×4块的最可能预测模式,故可以选择相邻4×4块预测模式的SATD值作为阈值,预先排除掉SATD大于该阈值的模式,这样可以预先排除大约50%的Intra4×4模式,避免了很多不必要的代价(Cost)计算,通过实现自适应阈值降低预测的计算复杂度。
引入阈值T,计算4×4块在最可能的预测模式下的Cost4×4值,如果Cost4×4的结果小于阈值T,那么就把它作为当前4×4亮度块的最佳预测模式;否则,继续计算其他的预测模式。在这里阈值T的选取就是至关重要的地方,如果T较小,则不能有效的减少需要计算的预测模式数;否则如果T较大,较容易选择“最可能的预测模式”,作为最终的结果,不能有效的找到当前块的最佳预测模式。一般的,在图像内容比较复杂的区域,可以适当的增大T的值;否则,应该减小T的值。另外,T的选择与QP值的大小也有关系;当QP较大时,预测误差较大,则应该适当的增大T的值;否则,应该减小T的值。据经验分析,如果最可能的预测模式就是最佳预测模式,绝大多数情况下D块的预测残差与A或B或C块的预测残差十分接近。而SATD值反应的是预测模式对当前纹理结构的近似效果,所以取A、B和C块Cost4×4值较小的一个作为D块的Cost4×4预测期望值。再将λ(QP)的作用考虑内,我们将阈值T设定为:
篇13
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、WAVELET的历史起源
WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、WAVELET影像压缩简介及基础理论介绍
一、WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。
二、影像压缩过程
原始图形资料色彩模式转换&n
bsp;DCT转换量化器编码器编码结束
三、编码的基本要素有三点
(一)一种压缩/还原的转换可表现在影像上的。
(二)其转换的系数是可以量化的。
(三)其量化的系数是可以用函数编码的。
四、现有WAVELET影像压缩工具主要的部份
(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。
(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。
(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、WAVELET影像压缩未来的发展趋势
一、在其结构上加强完备性。
二、修改程式,使其可以处理不同模式比率的影像。
三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、加强运算的能力,使其可支援更多的影像格式。
五、使用WAVELET转换藉由消除高频率资料增加速率。
六、增加多种的WAVELET。如:离散、零元树等。
七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、增加8X8格的DCT模式,使其能做JPEG的压缩。
九、增加8X8格的DCT模式,使其能重叠。
十、增加trelliscoding。
十一、增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、影像压缩研究的方向
1.输入装置如何捕捉真实的影像而将其数位化。
2.如何将数位化的影像资料转换成利於编码的资料型态。
3.如何控制解码影像的品质。
4.如何选择适当的编码法。
5.人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.Geoff&nb
sp;Davis,1997,WaveletImageCompressionConstructionKit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。
7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。
附录:
嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送
目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。
阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。
基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。
LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。