第三章
数字视频基础知识
3.1 视频的基础知识
在人类接受的信息中,有70%来自视觉,其中视频是最直观、最具体、信息量最丰富的。我们在日常生活中看到的电视、电影、VCD、DVD以及用摄像机、手机等拍摄的活动图像等都属于视频的范畴。
摄影机是指用胶片拍摄电影的机器,摄像机是用磁带、光盘、硬盘等作为界质记录活动影像的机器,广泛用于电视节目制作、家庭及其他各个方面。
摄影机使用胶片和机械装置记录活动影像,所采用的是光学和化学记录方式,摄象机是采用电子记录方式。
1 视频的定义
?视频(Video)就其本质而言,是内容随时间变化的一组动态图像(25或30帧/秒),所以视频又叫作运动图像或活动图像。
?一帧就是一幅静态画面,快速连续地显示帧,便能形运动的图像,每秒钟显示帧数越多,即帧频越高,所显示的动作就会越流畅。
『视觉暂留现象』
?人眼在观察景物时,光信号传人大脑神经,需经过一段短暂的时间,光的作用结束后,视觉形象并不立即消失,这种残留的视觉称“后像”,视觉的这一现象则被称为“视觉暂留现象”。
?具体应用是电影的拍摄和放映。
?根据实验人们发现要想看到连续不闪烁的画面,帧与帧之间的时间间隔最少要达到是二十四分之一秒。
?视频信号具有以下特点:
?内容随时间而变化
?有与画面动作同步的声音(伴音)
?图像与视频是两个既有联系又有区别的概念:静止的图片称为图像(Image),运动的图像称为视频(Video)。
?图像与视频两者的信源方式不同,图像的输入靠扫描仪、数字照相机等设备;视频的输入是电视接收机、
摄象机、录象机、影碟机以及可以输出连续图像信号的设备。
2.视频的分类
?按照处理方式的不同,视频分为模拟视频和数字视频。
?模拟视频(Analog Video)
?模拟视频是用于传输图像和声音的随时间连续变化的电信号。早期视频的记录、存储和传输都采用模拟方式,如在电视上所见到的视频图像是以一种模拟电信号的形式来记录的,并依靠模拟调幅的手段在空间传播,再用盒式磁带录像机将其作为模拟信号存放在磁带上。
?模拟视频的特点:
?以模拟电信号的形式来记录
?依靠模拟调幅的手段在空间传播
?使用磁带录象机将视频作为模拟信号存放在磁带上
?传统视频信号以模拟方式进行存储和传送然而模拟视频不适合网络传输,在传输效率方面先天不足,而且图像随时间和频道的衰减较大,不便于分类、检索和编辑。
?要使计算机能对视频进行处理,必须把视频源即来自于电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号转换成计算机要求的数字视频形式,这个过程称为视频的数字化过程。
?数字视频可大大降低视频的传输和存储费用、增加交互性、带来精确稳定的图像。
?如今,数字视频的应用已非常广泛。包括直接广播卫星(DBS)、有线电视(如图5.2)、数字电视在内的各种通信应用均需要采用数字视频。
?一些消费产品,如VCD和DVD,数字式便携摄像机,都是以MPEG视频压缩为基础的。
数字化视频的优点
?适合于网络应用
?在网络环境中,视频信息可方便地实现资源共享。视频数字信号便于长距离传输。
?再现性好
?模拟信号由于是连续变化的,所以不管复制时精确度多高,失真不可避免,经多次复制后,误差就很大。
数字视频可不失真地进行无限次拷贝,其抗干扰能力是模拟图像无法比拟的。它不会因存储、传输和复制而产生图像质量的退化,能准确再现图像。
?便于计算机编辑处理
?模拟信号只能简单调整亮度、对比度和颜色等,限制了处理手段和应用范围。而数字视频信号可以传送到计算机内进行存储、处理,很容易进行创造性地编辑与合成,并进行交互。
数字视频的不足
?数字视频的缺陷是处理速度慢,数据存储空间大,数字图像处理成本高。
?通过对数字视频的压缩,可以节省大量存储空间,光盘技术的应用也使得大量视频信息的存储成为可能。
3.视频的制式
?NTSC制在美国、日本和加拿大被广为使用,NTSC制式的视频图像为每秒30帧,每帧525行;
?PAL制主要被中国、澳大利亚和大部分西欧国家采用,PAL制式的视频画面为每秒25帧,每帧625行;
?SECAM制主要在法国、中东和东欧一些国家使用,SECAM制式的视频画面为每秒25帧,每帧625行。
?我们在日常生活中所见到的视频绝大多数为PAL制和NTSC制。
4.视频分辨率
?视频分辨率指的是视频的画面大小,常用图像的“水平像素×垂直像素”来表示。
?VCD 视频光盘的标准分辨率为352×288 (PAL )或352×240(NTSC) ;
?SVCD 视频光盘的标准分辨率为480×576 (PAL )或480×480 (NTSC );
?DVD 视频光盘的标准分辨率为720×576 (PAL )或720×480(NTSC) 。
?普通电视信号的分辨率为640×480 ;标清电视信号分辨率为720×576 ;
?高清电视(HDTV )分辨率可达1920×1080 。
3.2 数字视频的生成
?数字视频有两种生成方式:
?一是使用视频采集卡将模拟视频信号经计算机模/数转换后,生成数字视频文件,对这些数字视频文件进行数字化视频编辑,制作成数字视频文件,利用这种方式处理后的图像和原图像相比,信号有一定的损失;
?二是利用数字摄像机(硬盘式、光盘式和存储卡式数字摄像机)将视频图像拍摄下来,从信号源开始,就是无失真的数字视频,输入计算机后,通过使用的编辑软件制作成数字视频文件。
3.3 视频压缩的一些基本概念
?视频压缩(compression)的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压缩比一般指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像,因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处,但是运动的视频还有其自身的特性,因此在压缩时还应考虑其运动特性才能达到高压缩的目标。
?有损和无损压缩
?帧内和帧间压缩
?对称和不对称编码
?有损和无损压缩
?在视频压缩中有损和无损的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。
?帧内和帧间压缩
?帧内压缩也称为空间压缩。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。
?采用帧间压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩,它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。
?3.对称和不对称编码
?对称性是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,尔后再播放,因此可以采用不对称编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要10 多分钟的时间,而该片断实时回放时间只有三分钟。
3.4 常见的数字视频文件格式
1. A VI格式
A VI(Audio Video Interleaved ,音频视频交错)格式是一种可以将视频和音频交织在一起进行同步播放的数字视频文件格式。A VI格式由Microsoft公司于1992年推出,随Windows3.1一起被人们所认识和熟知。它采用的压缩算法没有统一的标准,除Microsoft公司之外,其他公司也推出有自己的压缩算法,只要把该算法的驱动加到Windows系统中,就可以播放该算法压缩的A VI文件。A VI格式的优点是图像质量好,可以跨多个平台使用,但是其缺点是体积过于庞大,其文件扩展名为.avi。
2.MPEG格式
?MPEG(Moving Pictures Experts Group,动态图像专家组)是1988年成立的一个专家组,其任务是负责制订有关运动图像和声音的压缩、解压缩、处理以及编码表示的国际标准。MPEG格式是采用了有损压缩方法从而减少运动图像中的冗余信息的数字视频文件格式。目前MPEG格式有三个压缩标准,分别是MPEG -1 、MPEG-2、和MPEG-4。
?MPEG-1制定于1992年,它是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准。使用MPEG-1的压缩算法,可以把一部时长120分钟的电影(视频文件)压缩到1.2GB左右。这种数字视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg以及VCD光盘中的.dat等。
?MPEG-2制定于1994年,是为高级工业标准的图像质量以及更高的传输率而设计的。这种格式主要应用在DVD和SVCD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有较广的应用。使用MPEG-2的压缩算法,可以把一部时长120分钟的电影压缩到4~8GB。这种数字视频格式的文件扩展名包括. mpg、.mpe、.mpeg、.m2V及DVD光盘中的.vob等。
?MPEG-4制定于1998年,是为播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量。MPEG-4能够保存接近于DVD 画质的小体积视频文件,还包括了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。使用MPEG-4的压缩算法的ASF格式可以把一部120min的电影(视频文
件)压缩到300MB左右的视频流,可供在线观看。这种数字视频格式的文件扩展名包括.asf和.mov。
3.RM格式
?RM(RealMedia)格式是Networks公司所制定的音频视频压缩规范。用户可以使用RealPlayer或RealOnePlayer对符合RealMedia技术规范的网络音频/视频资源进行实况转播,并且RealMedia还可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放。这种数字视频格式的文件扩展名包括.rm、.ra和.ram。
4.RMVB格式
?RMVB格式是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源,也就是说,静止和动作场面少的画面场景采用较低的编码速率,这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用。这样在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,使图像质量和文件大小之间就达到了微妙的平衡。这种数字视频格式的文件扩展名为rmvb和.rm。
5.WMV格式
?WMV(Windows MediaVideo)格式Microsoft公司将其名下的ASF(Advanced Stream Format)格式升级延伸来得一种流媒体格式。WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、可伸缩的媒体类型、多语言支持、环境独立性、丰富的流间关系以及扩展性等。其文件扩展名为.wmv。
6.MOV格式
?MOV格式是美国Apple公司开发的一种视频格式,默认的播放器是Apple公司的QuickTime Player。MOV格式不仅能支持MacOS,同样也能支持Windows系列计算机操作系统,有较高的压缩比率和较完美的视频清晰度。MOV格式定义了存储数字媒体内容的标准方法,使用这种文件格式不仅可以存储单个的媒体内容,如视频帧或音频采样数据,而且还能保存对该媒体作品的完整描述。因为这种文件格式能用来描述几乎所有的媒体结构,所以它是不同系统的应用程序间交换数据的理想格式。这种数字视频格式的文件扩展名包括.qt、.mov等。
7.DivX格式
?DivX格式是由MPEG-4衍生出的另一种视频编码(压缩)标准,也即我们通常所说的DVDrip格式,它采用了MPEG-4的压缩算法,同时又综合了MPEG-4与MP3各方面的技术,即使用DivX压缩技术对DVD 盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩,然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD,但文件大小只有DVD的几分之一,并且对机器的要求也不高,因此DivX格式可以说是一种对DVD造成威胁最大的新生视频压缩格式。其文件扩展名为.avi。
8.FLV格式
?FLV (FLASH VIDEO)格式是随着Flash MX的推出发展而来的流媒体视频格式。它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点。FL V文件体积极小,1分钟清晰的FLV视频大小在1MB左右,加上CPU占用率低,视频质量良好等特点使其在网络上极为盛行。目前网上多数视频网站使用的都是这种格式的视频。其文件扩展名为.flv。
9. 3GP格式
?3GP是一种3G流媒体的视频编码格式,主要是为了配合3G网络的高传输速度而开发的一种媒体格式,具有很高的压缩比,特别适合手机上观看电影。3GP格式的视频文件体积小,移动性强,适合在手机、PSP 等移动设备使用,缺点是在PC机上兼容性差,支持软件少,且播放质量差,帧数低,较A VI等格式相差很多。其文件扩展名为.3gp。
10. MTS格式
?MTS视频格式是一种新兴的高清视频格式,常见于sony高清DV录制的视频,其视频编码通常采用H264,音频编码采用AC-3,分辨率为1920×1080或1440×1080,是一种达到高清甚至全高清标准的格式,也是一种蓝光标准的格式。播放MTS视频格式不同于A VI等传统格式,所有电脑都能良好的兼容播放,如果机器性能较弱,就有可能发生播放不流畅的情况。MTS视频格式画质非常高,也就决定了它体积非常大,所以通过高清录像机录制的MTS,常常需要进行转换,以减小视频的体积,另外,如果需要在影碟机上播放录制的视频,也需要转换成DVD格式。其文件扩展名为.mts。
11. F4V格式
?F4V是Adobe公司为了迎接高清时代而推出继FLV格式后的支持H.264的F4V流媒体格式。
?它和FLV主要的区别在于,FLV格式采用的是H.263编码,而F4V则支持H.264编码的高清晰视频,码率最高可达50Mbps。
?使用最新的Adobe Media Encoder CS4软件即可编码F4V格式的视频文件。
?现在主流的视频网站(如土豆、酷6、优酷)都开始用H.264编码的F4V文件,相同文件大小情况下,清晰度明显比H.263编码的FLV要好.
3.5 数字视频格式转换
?WinA VI Video Converter
?Total Video Converter
?艾奇MTS视频格式转换器格式工厂 3.5 网络视频的获取利用Internet临时文件夹获取视频C:\Documents and Settings\Administrator\Local Settings\Temporary Internet Files
数字视频基础 数字视频的采样格式及数字化标准 模拟视频的数字化包括不少技术问题,如电视信号具有不同的制式而且采用复合的YUV信号方式,而计算机工作在RGB空间;电视机是隔行扫描,计算机显示器大多逐行扫描;电视图像的分辨率与显示器的分辨率也不尽相同等等。因此,模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。 模拟视频一般采用分量数字化方式,先把复合视频信号中的亮度和色度分离,得到YUV或YIQ分量,然后用三个模/数转换器对三个分量分别进行数字化,最后再转换成RGB 空间。 一、数字视频的采样格式 根据电视信号的特征,亮度信号的带宽是色度信号带宽的两倍。因此其数字化时可采用幅色采样法,即对信号的色差分量的采样率低于对亮度分量的采样率。用Y:U:V来表示YUV三分量的采样比例,则数字视频的采样格式分别有4:1:1、4:2:2和4:4:4三种。电视图像既是空间的函数,也是时间的函数,而且又是隔行扫描式,所以其采样方式比扫描仪扫描图像的方式要复杂得多。分量采样时采到的是隔行样本点,要把隔行样本组合成逐行样本,然后进行样本点的量化,YUV到RGB色彩空间的转换等等,最后才能得到数字视频数据。 二、数字视频标准 为了在PAL、NTSC和 SECAM电视制式之间确定共同的数字化参数,国家无线电咨询委员会(CCIR)制定了广播级质量的数字电视编码标准,称为CCIR 601标准。在该标准中,对采样频率、采样结构、色彩空间转换等都作了严格的规定,主要有: =13.5MHz 1、采样频率为f s 2、分辨率与帧率 的采样率,在不同的采样格式下计算出数字视频的数据量: 3、根据f s 这种未压缩的数字视频数据量对于目前的计算机和网络来说无论是存储或传输都是不现实的,因此在多媒体中应用数字视频的关键问题是数字视频的压缩技术。 三、视频序列的SMPTE表示单位 通常用时间码来识别和记录视频数据流中的每一帧,从一段视频的起始帧到终止帧,其间的每一帧都有一个唯一的时间码地址。根据动画和电视工程师协会SMPTE(Society of
数字视频技术总复习题 一基本概念填空题 1 摄像机在拍摄时,通过光敏器件,将光信号转换为电信号,这种电信号就是(RGB)信号。 2 模拟彩色电视机的制式主要有(NTSC制、PAL制和SECAM制);中国、朝鲜等国家采用(PAL)制式彩色电视机标准。 3 电视机的扫描方式有(隔行扫描和非隔行扫描(逐行扫描))之分。 4 行频f H是指(每秒钟扫描多少行);场频f f是指(每秒钟扫描多少场);每秒扫描多少帧称为(帧频)f F。 5 PAL制式电视的场扫描频率是(50 Hz),周期为(20 ms);帧频是25 Hz,是场频的(一半),周期为(40 ms)。 6 彩色电视中,用Y、C1, C2彩色表示法分别表示亮度信号和两个色差信号,C1,C2的含义与具体的应用有关。在NTSC彩色电视制中,C1,C2分别表示(I、Q)两个色差信号;在PAL彩色电视制中,C1,C2分别表示(U、V)两个色差信号;在CCIR 601数字电视标准中,C1,C2分别表示(Cr,Cb)两个色差信号。 7 电视图像数字化常用的方法有两种,一种是(从复合彩色电视图像中分离出彩色分量,然后数字化);另一种是(用一个高速A/D转换器对彩色全电视信号进行数字化,然后在数字域中进行分离,以获得所希望的YCbCr,YUV,YIQ 或RGB分量数据)。 8 NTSC制、PAL制和SECAM制共同的电视图像采样频率是fs=(13.5MHZ)。 9 目前数字电视图像使用(MPEG-2)video标准。 10 目前传输数字电视的主要方式是(卫星,地面广播和电缆);用它们传输的电视分别称为(卫星数字电视、地面数字电视和有线数字电视)。 11 数字彩色电视机的制式主要有(ATSC DTV、DVB和ISDB)。中国等国家采用(欧洲DVB)制式数字彩色电视机标准。 12 数字电视的视频接口主要有(DVI、HDMI、UDI和DisplayPort)四种接口。 13 模拟电视信号转换为数字电视信号的过程是(模拟/数字转换编码过程),称可为(PCM调制脉冲编码调制),由(A/D转换器实现)。数字电视信号转换为模拟信号则称(PCM解调过程),由(D/A转换器实现)。 14全数字电视系统的信源编码采用(MPEG-2标准对数字化视频信号进行)压缩编码,其目的是(降低数字信号的传输码率)。 15全数字电视系统压缩编码后的数字视频信号在调制前,为了保证在传输工程中尽可能减少差错,通常还要加入(用于纠错的RS码和卷积码)。其目的是(提高数字信号的传输的可靠性)。 16 为了在编码中实现最大的压缩比,MPEG使用三种类型的图像,分别是(I 帧、P帧和B帧)。 17 VCD视频压缩采用(MPEG-1)标准,图像分辨率为(352×240);DVD视频压缩采用(MPEG-2)标准,图像分辨率为(720×480). 18 信息熵表示的是(信源产生信息量的大小)。信息熵越大,不确定度越大,所含信息越多。
数据通信基本知识 -------------------------------------------------------------------------- 所有计算机之间之间通过计算机网络的通信都涉及由传输介质传输某种形式的数据编码信号。传输介质在计算机、计算机网络设备间起互连和通信作用,为数据信号提供从一个节点传送到另一个节点的物理通路。计算机与计算机网络中采用的传输介质可分为有线和无线传输介质两大类。 一、有线传输介质(Wired Transmission Media) 有线传输介质在数据传输中只作为传输介质,而非信号载体。计算机网络中流行使用的有线传输介质(Wired Transmission Media)为:铜线和玻璃纤维。 1. 铜线 铜线(Copper Wire)由于具有较低的电阻率、价廉和容易安装等优点因而成为最早用于计算机网络中的传输介质,它以介质中传输的电流作为数据信号的载体。为了尽可能减小铜线所传输信号之间的相互干涉(Interference),我们使用两种基本的铜线类型:双绞线和同轴电缆。 (1)双绞线 双绞线(Twisted Pair)是把两条互相绝缘的铜导线纽绞起来组成一条通信线路,它既可减小流过电流所辐射的能量,也可防止来自其他通信线路上信号的干涉。双绞线分屏蔽和无屏蔽两种,其形状结构如图1.1所示。双绞线的线路损耗较大,传输速率低,但价格便宜,容易安装,常用于对通信速率要求不高的网络连接中。 (2)同轴电缆 同轴电缆(Coaxial Cable)由一对同轴导线组成。同轴电缆频带宽,损耗小,具有比双绞线更强的抗干扰能力和更好的传输性能。按特性阻抗值不同,同轴电缆可分为基带(用于传输单路信号)和宽带(用于同时传输多路信号)两种。同轴电缆是目前LAN局域网与有线电视网中普遍采用的比较理想的传输介质。 2.玻璃纤维 目前,在计算机网络中十分流行使用易弯曲的石英玻璃纤维来作为传输介质,它以介质中传输的光波(光脉冲信号)作为信息载体,因此我们又将之称为光导纤维,简称光纤(Optical Fiber)或光缆(Optical Cable)。 光缆由能传导光波的石英玻璃纤维(纤芯),外加包层(硅橡胶)和保护层构成。在光缆一头的发射器使用LED光发射二极管(Light Emitting Diode)或激光(Laser)来发射光脉冲,在光缆另一头的接收器使用光敏半导体管探测光脉冲。 模拟数据通信与数字数据通信 一、通信信道与信道容量(Communication Channel & Channel Capacity) 通信信道(Communication Channel)是数据传输的通路,在计算机网络中信道分为物理信道和逻辑信道。物理信道指用于传输数据信号的物理通路,它由传输介质与有关通信设备组成;逻辑信道指在物理信道的基础上,发送与接收数据信号的双方通过中间结点所实现的逻?quot;联系",由此为传输数据信号形成的逻辑通路。逻辑信道可以是有连接的,也可以是无连接的。物理信道还可根据传输介质的不同而分为有线信道和
多视点视频编解码 吕永超 [摘要]与二维视频编码有所不同,多视点视频编码还存在不同视点间的 空间冗余,因此除了进行运动估计和运动补偿外,还需要对立体视频进 行视差补偿预测,来消除视点间的空间冗余,提高视频压缩的效率。大 模块所占比率大,耗时少,小模块所占比例小,但是耗时多。而且,立 体视频编码中,小模块模式相对于平面视频编码所占的比例更少,这也 说明了立体视频编码中模式选择的重要性。JMVC测试模型遍历所有模式然后选择最优编码模式,致使编码速度低下。我们通过快速模式选择, 尽可能的减少小模块模式的预测,在保证图像质量和压缩效率的基础上,大幅度的提高了立体视频编码速度。CPU单独解码效率较低,最多仅能 支持6个视点1280X720P格式的高清视频实时解码。而基于本文提出的CPU和GPU混合解码技术,由于IDCT和彩色空间变换这些并行运算均有GPU完成,充分发掘了当前GPU的特点,CPU主要负责解码控制类型的 运算,整体解码运算效率较高,可以实时解码8个视点的1280X720P格 式的高清视频。 [关键词] 多视点视频快速帧间模式选择IDCT和图像彩色空间变换
目录 第一章绪论 (1) 第二章多视点视频编码 (1) 2.1多视点视频编码原理 (1) 2.2视频编码方案 (2) 2.3立体视频运动估计搜索算法 (3) 2.4快速帧间模式选择 (3) 2.5本章小结 (3) 第三章基于GPU和CPU混合运算的解码技术 (4) 3.1 IDCT运算在GPU上实现的基本原则 (4) 3.2图像彩色空间变化在GPU上的实现 (4) 3.3 本章小结 (4) 参考文献 (5)
模拟电视电路中处理的信号越复杂失真越大,稳定性也越差,而数字电视在信号处理过程中几乎不受外界干扰,可毫无失真的使信号还原。因此数字电视图像清晰,色彩更加鲜艳逼真。按照规划,我国将在2005年开展数字卫星直播业务,2008年全面推广地面数字电视,2015年停止模拟电视播出。实现模拟电视和数字电视的兼容要处理的主要问题之一是将隔行信号转化为逐行信号,即去隔行。 第七章数字视频处理
目前主要的去隔行方法有: 9一维处理法:利用本场信息插补出未知像素点.9二维处理法:比较前后场中的信息,将两场中静止 区域的数据相编织,运动区域只 使用其中一场的数据去插补。 9 三维运动补偿法:沿着运动估计得到的物体运动 轨迹对运动图像插补。 目前的电视中只有少数高端产品具有简单的 运动补偿功能。国内外研究现状
主要内容 一、运动估计 二、运动补偿 三、去隔行算法 四、去隔行算法FPGA实现 五、小波SPIHT编码方法C语言及 DSP实现
7.1 运动估计 运动估计是根据帧间的运动信息得到帧内像素点的运动位移(又称为运动矢量,Motion Vector)。视频处理系统中,运动估计是非常重要的一个环节,它可以广泛应用于视频压缩、格式转换、滤波等。去隔行中,运动估计的好坏直接影响到变换后的效果。主要有以下三种运动估计方法: ?基于像素的运动估计 ?基于块的运动估计 ?多分辨率运动估计
一基于像素的运动估计 基于像素的运动估计思想是要估计每一个像 素的运动矢量,运算量非常大,进而提出了像素 递归算法。在像素递归算法中,运动矢量是递归 得出的。当前像素的运动矢量是根据在此之前已 经得到的邻近像素的运动矢量或它们的线性组合 得到。 返回
第三章 数字视频基础知识 3.1 视频的基础知识 在人类接受的信息中,有70%来自视觉,其中视频是最直观、最具体、信息量最丰富的。我们在日常生活中看到的电视、电影、VCD、DVD以及用摄像机、手机等拍摄的活动图像等都属于视频的范畴。 摄影机是指用胶片拍摄电影的机器,摄像机是用磁带、光盘、硬盘等作为界质记录活动影像的机器,广泛用于电视节目制作、家庭及其他各个方面。 摄影机使用胶片和机械装置记录活动影像,所采用的是光学和化学记录方式,摄象机是采用电子记录方式。 1 视频的定义 ?视频(Video)就其本质而言,是内容随时间变化的一组动态图像(25或30帧/秒),所以视频又叫作运动图像或活动图像。 ?一帧就是一幅静态画面,快速连续地显示帧,便能形运动的图像,每秒钟显示帧数越多,即帧频越高,所显示的动作就会越流畅。 『视觉暂留现象』 ?人眼在观察景物时,光信号传人大脑神经,需经过一段短暂的时间,光的作用结束后,视觉形象并不立即消失,这种残留的视觉称“后像”,视觉的这一现象则被称为“视觉暂留现象”。 ?具体应用是电影的拍摄和放映。 ?根据实验人们发现要想看到连续不闪烁的画面,帧与帧之间的时间间隔最少要达到是二十四分之一秒。 ?视频信号具有以下特点: ?内容随时间而变化 ?有与画面动作同步的声音(伴音) ?图像与视频是两个既有联系又有区别的概念:静止的图片称为图像(Image),运动的图像称为视频(Video)。 ?图像与视频两者的信源方式不同,图像的输入靠扫描仪、数字照相机等设备;视频的输入是电视接收机、
摄象机、录象机、影碟机以及可以输出连续图像信号的设备。 2.视频的分类 ?按照处理方式的不同,视频分为模拟视频和数字视频。 ?模拟视频(Analog Video) ?模拟视频是用于传输图像和声音的随时间连续变化的电信号。早期视频的记录、存储和传输都采用模拟方式,如在电视上所见到的视频图像是以一种模拟电信号的形式来记录的,并依靠模拟调幅的手段在空间传播,再用盒式磁带录像机将其作为模拟信号存放在磁带上。 ?模拟视频的特点: ?以模拟电信号的形式来记录 ?依靠模拟调幅的手段在空间传播 ?使用磁带录象机将视频作为模拟信号存放在磁带上 ?传统视频信号以模拟方式进行存储和传送然而模拟视频不适合网络传输,在传输效率方面先天不足,而且图像随时间和频道的衰减较大,不便于分类、检索和编辑。 ?要使计算机能对视频进行处理,必须把视频源即来自于电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号转换成计算机要求的数字视频形式,这个过程称为视频的数字化过程。 ?数字视频可大大降低视频的传输和存储费用、增加交互性、带来精确稳定的图像。 ?如今,数字视频的应用已非常广泛。包括直接广播卫星(DBS)、有线电视(如图5.2)、数字电视在内的各种通信应用均需要采用数字视频。 ?一些消费产品,如VCD和DVD,数字式便携摄像机,都是以MPEG视频压缩为基础的。 数字化视频的优点 ?适合于网络应用 ?在网络环境中,视频信息可方便地实现资源共享。视频数字信号便于长距离传输。 ?再现性好 ?模拟信号由于是连续变化的,所以不管复制时精确度多高,失真不可避免,经多次复制后,误差就很大。
通信常识:波特率、数据传输速率与带宽的相互关系 【带宽W】 带宽,又叫频宽,是数据的传输能力,指单位时间能够传输的比特数。高带宽意味着高能力。数字设备中带宽用bps(b/s)表示,即每秒最高可以传输的位数。模拟设备中带宽用Hz表示,即每秒传送的信号周期数。通常描述带宽时省略单位,如10M实质是10M b/s。带宽计算公式为:带宽=时钟频率*总线位数/8。电子学上的带宽则指电路可以保持稳定工作的频率围。 【数据传输速率Rb】 数据传输速率,又称比特率,指每秒钟实际传输的比特数,是信息传输速率(传信率)的度量。单位为“比特每秒(bps)”。其计算公式为S=1/T。T为传输1比特数据所花的时间。 【波特率RB】 波特率,又称调制速率、传符号率(符号又称单位码元),指单位时间载波参数变化的次数,可以以波形每秒的振荡数来衡量,是信号传输速率的度量。单位为“波特每秒(Bps)”,不同的调制方法可以在一个码元上负载多个比特信息,所以它与比特率是不同的概念。 【码元速率和信息速率的关系】 码元速率和信息速率的关系式为:Rb=RB*log2 N。其中,N为进制数。对于二进制的信号,码元速率和信息速率在数值上是相等的。 【奈奎斯特定律】 奈奎斯特定律描述了无噪声信道的极限速率与信道带宽的关系。 1924年,奈奎斯特(Nyquist)推导出理想低通信道下的最高码元传输速率公式:理想低通信道下的最高RB = 2W Baud。其中,W为理想低通信道的带宽,单位是赫兹(Hz),即每赫兹带宽的理想低通信道的最高码元传输速率是每秒2个码元。对于理想带通信道的最高码元传输速率则是:理想带通信道的最高RB= W Baud,即每赫兹带宽的理想带通信道的最高码元传输速率是每秒1个码元。 符号率与信道带宽的确切关系为: RB=W(1+α)。 其中,1/1+α为频道利用率,α为低通滤波器的滚降系数,α取值为0时,频带利用率最高,但此时因波形“拖尾”而易造成码间干扰。它的取值一般不小于0.15,以调解频带利用率和波形“拖尾”之间的矛盾。 奈奎斯特定律描述的是无噪声信道的最大数据传输速率(或码元速率)与信道带宽之间的关系。 【香农定理】 香农定理是在研究信号经过一段距离后如何衰减以及一个给定信号能加载多少数据后得到了一个著名的公式,它描述有限带宽、有随机热噪声信道的最大数据传输速率(或码元速率)与信道带宽、信噪比(信号噪声功率比)之间的关系,以比特每秒(bps)的形式给出一个链路速度的上限。
3.11 数字视频处理技术的发展 一、DSP数字处理技术 从90年代起,人类社会步入信息时代,而信息时代一个重要特征就是数字化的产品大行其道,其中最典型的代表就是以DSP为核心的技术及其产品应用。DSP是数字信号处理的英文缩写,但是它的发展已经超越了其自身的表面含义,它已经成为一种新的数字处理技术。特点是DSP在摄像机中的成功应用掀开了现代摄像技术的新篇章。成为继CCD之后的又一个划时代的摄像机新技术应用成果。 DSP数字信号处理技术是数字信号处理、微电子学、计算机科学和计算机数学的综合科研成果。DSP芯片现已广泛应用于磁量驱动器,蜂窗式电话、调制解调器、无线电接收机、微控制器、光盘机、数码相机和数字摄像机等诸多领域,并将在绝大部分的电子设备中得以应用。 DSP数字信号处理器在彩色摄像机中的应用使其成为整个系统最核心的部件之一,它的功能是通过一系列复杂的数字算法,对数字图像信号进行优化处理,包括白平衡、彩色平衡、伽玛校正及边缘校正等,这些优化处理将直接影响图像信号的质量。 就任何一个DSP芯片来说,其本质上都是一个单片微型计算机,但它是专门用来处理数字信号的,其最大特点就是运算速度极快,比普通的微型计算机快2个数量级,能在短时间内完成复杂而繁琐的数学运算。DSP数字信号处理摄像技术于90年代中期开发,并首先在VHS-C格式摄录机中应用。图3-81就是这种摄录机中DSP处理电路的典型结构图。
图中从CCD摄像头送出的图像信号经A/D变换成数字信号后就送进了DSP 数字信号处理集成电路。在集成电路中首先进行Y/C白平衡的调整,然后从Y/C 处理电路送出的数字信号经数字变焦后存入帧存储器。同时,数字变焦处理电路可根据不同比例,从帧存储器中取出放大或缩小的图像信号送到自动聚焦处理器,经过对信号中主频分量的分析,控制电机调整镜头距离,使信号中主频分量为最大,即最佳聚焦状态。 在掌中宝型摄录机的实际应用中一个重要的问题就是操作者手掌的晃动,由于晃动引起图像的不稳定,而不使手掌晃动又几乎是不可能的。因此,必须要在摄录机电路中解决这个问题,而电路中的模糊图像稳定处理,就是专门解决这个问题的。在图中,经Y/C处理的信号分出一路送运动检测电路,检测图像运动状态,并送入模糊处理电路。通过模糊逻辑分析,判断图像的运动是否由手抖引起的,电路根据手抖动的程度进行判断,认定是手抖动引起的晃动,则从储存器中选择读取图像信息去抵消图像的晃动。 经上述数字化处理后,再经D/A变换还原成模拟视频信号送入记录系统,并记录在磁带上。 经过几年的开发研制,DSP摄像技术已趋成熟。目前主要摄像机厂商代表当前最高水平的机型全部都采用了DSP摄像技术。如索尼公司3CCD DSP彩色摄像机DXC—D30Pjiushi比较突出的机型。(如图) 二、全数字化视频处理技术 目前数字摄像机仍有部分模拟处理电路,其发展方向是视频信号处理的全部数字化,而关键在于发展产量化。 比特的A/D转换器。目前最新一代的是14比特DSP数字信号处理的摄像机,如JYC公司的DY-90EC,DY-70EC(D9格式),SONY公司的DSR-PDX10P (DVCAM),松下公司的DVCPRRO50个市的AJ-D900等等,在性能上提高了图像清晰度,扩展了图像的细节校正,提供更为灵活的色度控制,增加了更大的过曝光信号的控制等等。 D Y-90 E C(D9格式)
第一章数字视频概述 1.什么是复合视频?2页,可改为填空题 例如:黑白视频信号是一个已经经过加工处理并包含扫描同步和消隐的图像信号,通常也叫做复合视频,简称视频。由于频带范围在1-6MHZ人们又把它叫做电视基带视频。 2.什么是视频技术?它主要应用在哪些领域?3页,可以改为填空题 例如:在不考虑电视调制发射和接收等诸多环节时,单纯考虑和研究电视基带信号的摄取、改善、传输、记录、编辑、显示的技术就叫做视频技术。 主要应用领域:广播电视的摄录编系统、安全及监控、视频通信和视频会议、远程教育及视听教学、影像医学、影音娱乐和电子广告。 3.什么是数字视频?5页 广义的数字视频表述为数字视频是指依据人的视觉暂留特性,借着计算机或微处理器芯片的高速运算,加上Codec技术、传输存储技术等来实现的以比特流为特征的,能按照某种时基规律和标准在显示终端上再现活动影音的信息媒介。狭义的数字视频时指与具体媒体格式所对应的数字视频。 第二章彩色数字视频基础 1.彩色电视系统是根据色光三基色原理来再现彩色图像的。按照此原理,任何一种色光颜色都可以用R G B三个彩色分量按一定的比例混合得到。7页 2.匹配兼容制彩色电视亮度信号的公式是:8页(2-2) 3.两个色差信号正交调制的目的是什么?10页 4.电视扫描分为逐行扫描和隔行扫描两种。 5.电视基带视频有复合视频、亮色分离视频和分量视频三种。13页 6.彩色电视制式有哪三种?制式差异主要体现在哪些方面?14页或改为填空 世界上现行的彩色电视制式有NTSC制式、PAL制式和SECAM制式三大制式。制式差异主要体现在亮度合成公式、色差信号提取、色副载选取及其正交调制类型、扫描方式、同步时基确定等方面的参数。 7.彩色电视图像的数字化有信号上游数字化和信号下游数字化两种。 8.A/D转换主要包括哪些环节?量化的实质是什么?编码的实质是什么?17,18页,可改为填空 A/D转换就是指对幅值连续变化的模拟视频电信号进行脉冲抽样保持、量化、编码等环节后形成二进制码流的技术处理过程。 9.一般常用的线性D/A转换器,其输出模拟电压U和输入数字量D之间成正比关系。19页 10.YCbCr信号和YUV信号是正比关系。21页,或选择A正比B反比C非线性D平方11.CCIR601标准为NTSC、PAL、和SECAM制式规定了共同的图像采样频率是13.5MHZ。21页 12.PAL制NTSC制的现行标准数字电视有效显示分辨率(清晰度)各为720X576像素和720X480像素。公用中分辨率为352X288像素。23页 第三章广义数字视频及分类 1.广义数字视频的定义?28页 2.广义的数字视频是依据人的视觉暂留特性,借助计算机或微处理器芯片的高速运算加上Codec编解码技术、传输存储技术等来实现的比特流为特征的全新的信息媒介。 3.图像序列的特点有哪些?33页 特点是每帧的分辨率相同,图像内容相关、图像文件名连续编号,而且有表示开始的图像序列头和表示结束的图像终止码。
数字视频技术考复习题 一、填空题 1、MPEG-1视频流采取分层式数据结构,包括视频序列、、图像、 像条、、块共六层。 2、已知HDB3码为-1000-1+1000+l-l+l-100-1+l,原信息代码 为。 3、以在上一帧图像中找到相似的块,这两个宏块之间的位移,称为。 4、数字复接过程中,按各支路信号的交织情况来分,可以分为复 接、复接和复接。 5、视频基本码流(ES)层次结构由视频序列层、、、像条层、 宏块层和。 6、当前宏块与它匹配的宏块之间的差值称为。 7、模拟彩色电视信号,世界存在三种制式,它们分别是制、制 和制。 8、PAL制式彩色电视信号中,为了节省频带宽度,一般将色度信号调制在 -----MHZ的频率上,再安插在信号中。 9、在NTSC制式电视信号中,色度矢量的幅度代表,初 相位代表。 10、标准清晰度电视演播室标准规定,亮度信号每行的取样点 数,取样频率为MH Z。 11、基带传输时,接收波形满足取样值无串扰的充要条件是:仅在本码元的取 样时刻上有,而在其他码元的取样时刻,本码元的值为。 12、准同步复接中一般采用正码速调节,其方式为当缓存器即将读空时,禁止 读时钟输出,使缓存器读出一位,在输出码流中插入一个,可以把码速调高。 13、某一信道传输二进制时,速率为a,如果利用这一信道传输8进制时, 传输速率将是。 14、MPEG-2结构可分为和层,针对不同的环 境,MPEG-2规定了两种系统编码句法,分时是流和流。 15、H.264标准算法在概念上分为2个层次,分别是层和层。 16、H.264除了有I、P、B帧之外,还有2个切换帧,分别是帧 和帧。 17、SDH帧结构由和两大部分组成,他们的字长分别 ()和。 18、在一个STM-1中,可包容的基群个数为。
数据通信基本知识 所有计算机之间之间通过计算机网络的通信都涉及由传输介质传输某种形式的数据编码信号。传输介质在计算机、计算机网络设备间起互连和通信作用,为数据信号提供从一个节点传送到另一个节点的物理通路。计算机与计算机网络中采用的传输介质可分为有线和无线传输介质两大类。 一、有线传输介质(Wired Transmission Media) 有线传输介质在数据传输中只作为传输介质,而非信号载体。计算机网络中流行使用的有线传输介质(Wired Transmission Media) 为:铜线和玻璃纤维。 1. 铜线 铜线(Copper Wire)由于具有较低的电阻率、价廉和容易安装等优点因而成为最早用于计算机网络中的传输介质,它以介质中传输的电流作为数据信号的载体。为了尽可能减小铜线所传输信号之间的相互干涉(Interference) ,我们使用两种基本的铜线类型:双绞线和同轴电缆。 (1) 双绞线 双绞线(Twisted Pair) 是把两条互相绝缘的铜导线纽绞起来组成一条通信线路,它既可减小流过电流所辐射的能量,也可防止来自其他通信线路上信号的干涉。双绞线分屏蔽和无屏蔽两种,其形状结构如图 1.1 所示。双绞线的线路损耗较大,传输速率低,但价格便宜,容易安装,常用于对通信速率要求不高的网络连接中。 (2) 同轴电缆 同轴电缆(Coaxial Cable) 由一对同轴导线组成。同轴电缆频带宽,损耗小,具有比双绞线更强的抗干扰能力和更好的传输性能。按特性阻抗值不同,同轴电缆可分为基带(用于传输单路信号)和宽带(用于同时传输多路信号)两种。同轴电缆是目前LAN局域网与有线电视网中普遍采用的比较理想的传输介质。 2. 玻璃纤维目前,在计算机网络中十分流行使用易弯曲的石英玻璃纤维来作为传输介质,它以介质中传输的光波(光脉冲信号)作为信息载体,因此我们又将之称为光导纤维, 简称光纤(Optical Fiber) 或光缆(Optical Cable) 。 光缆由能传导光波的石英玻璃纤维(纤芯),外加包层(硅橡胶)和保护层构成。在光缆一头的发射器使用LED光发射二极管(Light Emitting Diode) 或激光(Laser)来发射光脉冲,在光缆另一头的接收器使用光敏半导体管探测光脉冲。 模拟数据通信与数字数据通信 一、通信信道与信道容量(Communication Channel & Channel Capacity) 通信信道(Communication Channel) 是数据传输的通路,在计算机网络中信道分为物理信道和逻辑信道。物理信道指用于传输数据信号的物理通路,它由传输介质与有关通信设备组成;逻辑信道指在物理信道的基础上,发送与接收数据信号的双方通过中间结点所实现的逻?quot; 联系",由此为传输数据信号形成的逻辑通路。逻辑信道可以是有连接的,也可以是无连接的。物理信道还可根据传输介质的不同而分为有线信道和 无线信道,也可按传输数据类型的不同分为数字信道和模拟信道。信道容量(Channel
1.三基色原理:任何一种颜色可以通过三基色按不同比例混合得到。 照明光源的基色系包括红色、绿色和蓝色,称为RGB基色。R+G+B=White 反射光源的基色系包括青色、品色和黄色,称为CMY基色。C+M+Y=Black RGB和CMY基色系是互补的,也就是说混合一个色系中的两种彩色会产生另外一个色系中的一种彩色。 2.HVS(人类视觉系统) -人类获取外界图像、视频信息的工具。 视网膜有两种类型感光细胞: 锥状细胞:在亮光下起作用,感知颜色的色调。含有三种类型的锥状细胞。 杆状细胞:在暗一些的光强下工作,只能感知亮度信息。 3.相加混色法: 1)空间混色法:将三种基色光同时分别投射到同一平面的相邻3点,若3点相距足够近,由于人眼的分辨力有限和相加混色功能,因此,人眼看到的不是基色,而是这三种基色的混合色。 彩色显像管的现象就是利用了空间混色法。 2)时间混色法:按一定顺序轮流将三种基色光投射到同一平面上,由于人眼的视觉惰性和相加混色功能,因此,人眼看到的不是基色,而是这三种基色的混合色。 场顺序制彩色电视就是采用时间混色法以场顺序来传送三种基色信号的。 3)生理混色法:(立体彩色电视的显像原理) 4)全反射混色法:(投影电视的基本原理) 4.彩色电视三种制式: NTSC制:正交平衡调幅制(采用YIQ彩色空间) PAL制:正交平衡调幅逐行倒相制(采用YUV彩色空间) SECAM制:行轮换调频制(采用YDbDr彩色空间) 矢量量化 编码--用二进制数来表示量化后样值的过程 9.量化:(将无限极的信号幅度变换成有限级的数码表示) 量化的用途 1)将模拟信号转换为数字信号,以便进行数字处理和传输 2)用于数据压缩 10.二维采样定理: 若二维连续信号f(x,y)的空间频率u和v分别限制在|u|<=Um、|v|<=Vm (Um、Vm为最高空间频率),则只要采样周期Δx、Δy满足Δx<=1/2Um、Δy<=1/2Vm,就可以由采样信号无失真的恢复原信号。 3.基于多分辨率的运动估计: 1)运动场接近最优解的概率更大;在较小分辨率层上,误差函数可以接近全局最小值,通过插值,获得高分辨率上的初始解,最后到达最大分辨率时,运动场很可能接近最优解。 2)计算量比直接在最大分辨率上进行运动估计时要小;在较小分辨率层上,搜索范围限制在较小的范围。 1.压缩时,视频冗余:
《单片机原理与接口技术》期中论文 论文题目HD-SDI数字视频信号处理及传输的FPGA设计与 实现 姓名 学号 学院电气工程学院 专业班级2008级通信工程
目录 引言 (3) 1.HD-SD I卡电路结构 (4) 2.HD-SD I数字行、场定时关系 (5) 3.视频数据的提取及处理 (9) 4.DMA控制模块 (13) 5.PLX9656局部总线到Avalon总线转换模块 (13) 6.实验调试 (14) 7.结束语 (15) 参考文献: (16)
HD-SD I数字视频信号处理及传输的FPGA设计与实现专业:通信工程姓名:黄鑫 摘要:设计了一种符合SMPTE292M标准的高清晰度数字电视信号采集传输用的HD-SD I卡,介绍了其电路结构,对HD-SD I中的视频数据、视频定时基准码、行号数据、校验码进行了分析,并就数字视频识别和提取模块、DMA传输模块和PLX9656 局部总线到Avalon总线的转换模块进行了设计。FPGA采用Altera公司的StratixEP1S25,实验调试结果表明, HD-SD I数字视频信号处理及传输工作稳定可靠。 关键词:高清晰度电视; 比特串行数字接口; HD-SD I; 现场可编程门阵列 FPGA design and implementation of HD-SD I digital video signal processing and transport Abstract: This paper designed a newly developed SDI card for HDTV of SMPTE292M, and gave the construction of the HD-SD I card’s circuits. Gave detailed analyses of video data, timing reference codes, line number data, DMA transport,conversion between PLX9656 local bus and Avalon bus. This paper also p resented the design of these model.The design adopted Altera’s Stratix EP1S25 as FPGA, and experimental results show that the processing and transport of HD-SD I card isstabilization and trustiness. Key words: HD-SD I; FPGA; bit-serial digital interface
数字视频处理 数字视频处理概述 数字视频就是先用摄像机之类的视频捕捉设备,将外界影像的颜色和亮度信息转变为电信号,再记录到储存介质(如录像带)。播放时,视频信号被转变为帧信息,并以每秒约30帧的速度投影到显示器上,使人类的眼睛认为它是连续不间断地运动着的。电影播放的帧率大约是每秒24帧。如果用示波器(一种测试工具)来观看,未投影的模拟电信号看起来就像脑电波的扫描图像,由一些连续锯齿状的山峰和山谷组成 为了存储视觉信息,模拟视频信号的山峰和山谷必须通过数字/模拟(D/A)转换器来转变为数字的“0”或“1”。这个转变过程就是我们所说的视频捕捉(或采集过程)。如果要在电视机上观看数字视频,则需要一个从数字到模拟的转换器将二进制信息解码成模拟信号,才能进行播放。 模拟视频的数字化包括不少技术问题,如电视信号具有不同的制式而且采用复合的YUV信号方式,而计算机工作在RGB空间;电视机是隔行扫描,计算机显示器大多逐行扫描;电视图像的分辨率与显示器的分辨率也不尽相同等等。因此,模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。 模拟视频一般采用分量数字化方式,先把复合视频信号中的亮度和色度分离,得到YUV或YIQ分量,然后用三个模/数转换器对三个分量分别进行数字化,最后再转换成RGB空间。 DSP是数字信号处理器的简称,在全球的数字化浪潮中,DSP以其高性能和软件可编程等特点,长期对数字媒体处理起到了积极的推动作用。最初DSP的应用在于专业数据通信和语音处理,各种专用调制解调器、声码器、数据加密机初步获得市场。其后DSP应用扩展到广泛的民用产品,诸如硬盘驱动器、通用调制解调器、数字答录机、无线通信终端。九十年代中DSP在数字GSM手机应用和无线基站应用中都获得了巨大的成功。与此同时,DSP开始全面拓展到新兴应用,并在宽带通信、数字控制、数字音频、数字视频等众多市场全球。现在,我们就DSP在数字视频行业中的应用进行分析。 视频行业的数字化,是模拟世界中数字化较晚的行业之一。原因主要是因为模拟视频的数字化产生巨大的数据量,造成应用的实现比较困难。随着互联网的速度提高,数字视频已经开始商业化,并逐步取代原来模式视频的地位。 现阶段在数字视频领域内,主要有以下一些DSP厂商:Philips、Equator、Ti、ADI、Cradle等等。各家厂商都有其特点,以下分别进行详细的介绍: 一、Philips视频处理DSP介绍: Philips是最早开发视频DSP的厂商之一,最早在1996年就推出了Trimedia 系列的第一款芯片TM-1000,当时主要的定位是数字电视方面的产品,随后推出了TM-1100、TM-1300、PNX-1300(TM-1300改进版)系列。虽然在数字电视方面没有取得很大的成功,但是PNX-1300系列芯片视频监控产品中得到了大规模的应用,也算是无心插柳柳成荫。随后飞利浦推出PNX-1500系列,也同样在视频监控应用上面成为主流。下一步飞利浦还将推出PNX1700系列。现在主流的PNX1500主流的300M内频,内部配有专门的媒体协处理器,在PNX1300系列的基础上,解决了以前PNX1300系列中功耗过大的问题,增加了网络口,IDE接口,提供了开发信息化家电和数字视频设备的主要接口;提供LED高分辨输出、高清视频输出(1920x1080)视频输出;具有视频滤波和De-interlace处理视频处理
数字视频信号基础 (白皮书) 目录 引言...................................................................................... - 2 -DVI –Digital Visual Interface ................................... - 4 -HDMI –High Definition Multimedia Interface ... - 6 -DisplayPort ....................................................................... - 8 -SDI –Serial Digital Interface .................................. - 10 -数字视频信号解析.......................................................... - 11 -保持数字信号的完整性 ................................................. - 13 -延长数字视频信号传输距离的解决方案.................... - 15 -数字内容保护(Digital Content Protection) ........... - 16 -内容提要 数字视频信号在AV行业内日趋普及。它和传统的模拟视频信号相比有很多不同,比如性能指标以及对整个信号链路的时基要求等。本文对数字视频信号的基础知识以及常见的数字视频信号进行了简要的介绍。同时,还介绍了如何利用眼图来对数字视频信号的完整性进行直观的量化,以及设计数字AV系统时数字视频信号修整功能的重要性。
南邮801通信原理基础知识99题 1、数字通信系统的有效性主要性能指标是______或______;可靠性主要性能指标是______或______。 2、信源编码可提高通信系统的______;信道编码可提高通信系统的______。 3、一离散信源输出二进制符号,在______条件下,每个二进制符号携带的1比特信息量;在______条件下,每个二进制符号携带的信息量大于1比特。 4、消息所含的信息量与该信息的________有关,当错误概率任意小时,信道的_______称为信道容量。 5、香农公式标明______和______指标是一对矛盾。 6、在t 秒内传输M 个N 进制的码元,其信息传输速率为______;码元传输速率为______。 7、某随机信号)(t m 的平均功率为0P ,则信号)(2 t m A 的平均功率 ______。 8、使用香农公式时,要求信号的概率分布为______,信道噪声为______。 9、窄带平稳高斯随机过程的同相分量与正交分量统计特性______,且都属于 ______信号,它的同相分量和正交分量的分布是_______,均值为______,包络一维分布服从______分布,相位服从______分布,如果再加上正弦波后包络一维分布服从______莱斯分布______。 10、设某随机信号的自相关函数为)( R ,______为平均功率,______为直流功率,______为交流功率。 11、某信道带宽为3kHz ,输出信噪比为63,则相互独立且等概率的十六进制数据无误码传输的最高传码率为______。 12、随参信道的三个特点是:______、______和______。 13、由电缆、光纤、卫星中继等传输煤质构成的信道是______信道,由电离层反射、对流层散射等传输煤质构成的信道是______信道。 14、经过随参信道传输,单频正弦信号波形幅度发生______变化,单频正弦信号频谱发生______变化。 15、窄带信号通过随参信道多径传输后,其信号包络服从______分布,称之为______型衰落。
数字视频技术 模式识别:摄像机+计算机模仿人眼+大脑 --- 图像、视频与色彩空间的应用 图像:模拟与数字图像;处理、传输、保存、检索、显示等;数字图像是可以看作是两个变量的离散函数f(x,y) 视频:视频是一个图像序列,数字视频可以看作是三个变量的离散函数f(x,y,t);帧率函数值可以是一个数值(灰度图像),也可以是一个向量(彩色图像) 一个基本视频通信系统的框架 视频采集系统—数字视频处理系统—视频编码系统—视频传输系统—视频解码系统—数字视频处理系统 图像的分类:二值化图像,灰度图像,彩色图像 像素:一个像素通常被视为图像的最小的完整采样 图像的空间分辨率:指图像中每单位长度所包含的像素或者点的数目 色彩空间就是表达色彩的数学模型(表达逻辑性)(需要计算机实现)(用不同方式表达同一色彩信息,因为应用不同) YUV颜色空间里,亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量,那么这样表示的图就是黑白灰度图。 彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题,使黑白电视机也能接收彩色信号。 数字视频技术 --- 图像处理中的数学工具 时域(空间域):加减乘除,微积分,直方图 频域:傅里叶变换,dct(数字余弦)变换 图像变换的实质是建立输入图像与输出图像之间所有各点之间映射关系的数学关系(函数)(线性,非线性)。 熵(信息量):混乱情况下信息量大
同空间,不同空间的转换:是为了通过转换,在保持信息量不变的情况下,找到更便于观察的方式 直方图:分析不同灰度值的浓度分布(所占百分比) 二次化的方法:1划定像素值范围2找出每个像素在图中出现的次数3横纵轴标注名称(横轴:像素值;纵轴:像素浓度比例) 卷积:选定一个对称轴相加 非线型处理:对图像局部处理线型处理:对图像全局处理 对图像平面进行直接的数据操作:空域操作 1加减乘除2线性与非线性函数变换3微分4卷积5矩阵操作 卷积在图像中的应用 用一个模板和一幅图像进行卷积,对于图像上的一个点,让模板的原点和该点重合,然后模板上的点和图像上对应的点相乘,然后各点的积相加,就得到了该点的卷积值。对图像上的每个点都这样处理。 边缘检测(卷积,依照需求选取核):一阶导数找出变化信息,检测出边缘信息 微分在图像中的应用 Sobel检测使用两个上述的3×3卷积内核来逼近水平边缘和垂直边缘。第一个矩阵(Sx)检测垂直边缘的变化,而第二个矩阵(Sy)检测水平边缘的变化。 傅立叶变换:将原来难以处理的时域信号转换成了易于分析的频域信号(信号的频谱)。 傅立叶变换提供另外一个角度来观察图像,可以将图像从灰度分布转化到频率分布上来观察图像的特征。 傅立叶变换在图像处理以下几个话题都有重要作用: 1.图像增强与图像去噪 2.图像分割之边缘检测