搜档网
当前位置:搜档网 › 各种音视频编解码详解 -- 标注版

各种音视频编解码详解 -- 标注版

各种音视频编解码详解 -- 标注版
各种音视频编解码详解 -- 标注版

各种音视频编解码详解

1.编解码学习笔记(一):基本概念

媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从wiki 上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫―天下维客‖。wiki的中文还是很不错的,但是阅读后建议再阅读英文。

我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹

基本概念

编解码

编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。

容器

很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。

FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、avi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。

视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。

参数介绍

采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称―位速率‖)相混淆。

采样定理表明采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz。换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。

对于语音采样:

?8,000 Hz - 电话所用采样率, 对于人的说话已经足够

?11,025 Hz

?22,050 Hz - 无线电广播所用采样率

?32,000 Hz - miniDV 数码视频camcorder、DAT (LP mode)所用采样率

?44,100 Hz - 音频CD, 也常用于MPEG-1 音频(VCD, SVCD, MP3)所用采样率

?47,250 Hz - Nippon Columbia (Denon)开发的世界上第一个商用PCM 录音机所用采样率

?48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率

?50,000 Hz - 二十世纪七十年代后期出现的3M 和Soundstream 开发的第一款商用数字录音机所用采样率

?50,400 Hz - 三菱X-80 数字录音机所用所用采样率

?96,000 或者192,000 Hz - DVD-Audio、一些LPCM DVD 音轨、Blu-ray Disc(蓝光盘)音轨、和HD-DVD (高清晰度DVD)音轨所用所用采样率

? 2.8224 MHz - SACD、索尼和飞利浦联合开发的称为Direct Stream Digital 的1 位sigma-delta modulation 过程所用采样率。

在模拟视频中,采样率定义为帧频和场频,而不是概念上的像素时钟。图像采样频率是传感器积分周期的循环速度。由于积分周期远远小于重复所需时间,采样频率可能与采样时间的倒数不同。

?50 Hz - PAL 视频

?60 / 1.001 Hz - NTSC 视频

当模拟视频转换为数字视频的时候,出现另外一种不同的采样过程,这次是使用像素频率。一些常见的像素采样率有:

?13.5 MHz - CCIR 601、D1 video

分辨率,泛指量测或显示系统对细节的分辨能力。此概念可以用时间、空间等领域的量测。日常用语中之分辨率多用于图像的清晰度。分辨率越高代表图像品质越好,越能表现出更多的细节。但相对的,因为纪录的信息越多,文件也就会越大。目前个人电脑里的图像,可以使用图像处理软件,调整图像的大小、编修照片等。例如photoshop,或是photoimpact等软件。

图像分辨率:

用以描述图像细节分辨能力,同样适用于数字图像、胶卷图像、及其他类型图像。常用'线每毫米'、'线每英吋'等来衡量。通常,―分辨率‖被表示成每一个方向上的像素数量,比如640x480等。而在某些情况下,它也可以同时表示成―每英吋像素‖ (pixels per inch,ppi)以及图形的长度和宽度。比如72ppi,和8x6英吋。

视频分辨率:

各种电视规格分辨率比较视频的画面大小称为―分辨率‖。数位视频以像素为度量单位,而类比视频以水平扫瞄线数量为度量单位。标清电视频号分辨率为720/704/640x480i60(NTSC)或768/720x576i50(PAL/SECAM)。新的高清电视(HDTV)分辨率可达1920x1080p60,即每条水平扫瞄线有1920个像素,每个画面有1080条扫瞄线,以每秒钟60张画面的速度播放。

画面更新率fps

Frame rate中文常译为―画面更新率‖或―帧率‖,是指视频格式每秒钟播放的静态画面数量。典型的画面更新率由早期的每秒6或8张(frame persecond,简称fps),至现今的每秒120张不等。PAL (欧洲,亚洲,澳洲等地的电视广播格式) 与SECAM (法国,俄国,部分非洲等地的电视广播格式) 规定其更新率为25fps,而NTSC (美国,加拿大,日本等地的电视广播格式) 则规定其更新率为29.97 fps。电影胶卷则是以稍慢的24fps在拍摄,这使得各国电视广播在播映电影时需要一些复杂的转换手续(参考Telecine转换)。要达成最基本的视觉暂留效果大约需要10fps的速度。

压缩方法

有损压缩和无损压缩

在视频压缩中有损(Lossy )和无损(Lossless)的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。

?无损格式,例如WAV,PCM,TTA,FLAC,AU,APE,TAK,WavPack(WV)

?有损格式,例如MP3,Windows Media Audio(WMA),Ogg Vorbis(OGG),AAC

帧内压缩和帧间压缩

帧内(Intraframe)压缩也称为空间压缩(Spatial compression)。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。

采用帧间(Interframe)压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩(Temporalcompression),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值(Frame differencing)算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。

对称编码和不对称编码

对称性(symmetric)是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,尔后再播放,因此可以采用不对称(asymmetric)编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要10多分钟的时间,而该片断实时回放时间只有三分钟。

除wiki外的资料来源:https://www.sodocs.net/doc/e49962487.html,/csyy/Using/200411/3142.html

资料压缩

港台将information翻译为资料资料压缩是透过去除资料中的冗余资讯而达成。就视讯资料而言,资料中的冗余资讯可以分成四类:

时间上的冗余资讯(temporal redundancy)

在视讯资料中,相邻的帧(frame)与帧之间通常有很强的关连性,这样的关连性即为时间上的冗余资讯。

这即是上一节中的帧间压缩。

空间上的冗余资讯(spatial redundancy)

在同一张帧之中,相邻的像素之间通常有很强的关连性,这样的关连性即为空间上的冗余资讯。这即是上一节中的帧内压缩。

统计上的冗余资讯(statistical redundancy)

统计上的冗余资讯指的是欲编码的符号(symbol)的机率分布是不均匀(non-uniform)的。

感知上的冗余资讯(perceptual redundancy)

感知上的冗余资讯是指在人在观看视讯时,人眼无法察觉的资讯。

视讯压缩

视讯压缩(英文:Video compression)是指运用资料压缩技术将数位视讯资料中的冗余资讯去除,降低表示原始视讯所需的资料量,以便视讯资料的传输与储存。实际上,原始视讯资料的资料量往往过大,例如未经压缩的电视品质视讯资料的位元率高达216Mbps,绝大多数的应用无法处理如此庞大的资料量,因此视讯压缩是必要的。目前最新的视讯编码标准为ITU-T视讯编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视讯组(JVT,Joint Video Team)所提出的H.264/AVC。

2.编解码学习笔记(二):codec类型

一个典型的视讯编码器:在进行当前信号编码时,编码器首先会产生对当前信号做预测的信号,称作预测信号(predicted signal),预测的方式可以是时间上的预测(interprediction),亦即使用先前帧的信号做预测,或是空间上的预测(intra prediction),亦即使用同一张帧之中相邻像素的信号做预测。得到预测信号后,编码器会将当前信号与预测信号相减得到残余信号(residual signal),并只对残余信号进行编码,如此一来,可以去除一部份时间上或是空间上的冗余资讯。接着,编码器并不会直接对残余信号进行编码,而是先将残余信号经过变换(通常为离散余弦变换)然后量化以进一步去除空间上和感知上的冗余资讯。量化后得到的量化系数会再透过熵编码,去除统计上的冗余资讯。

常见的编解码见下表,在以后会分类论述:

上面的表格,查看某个具体的codec,可以在中文的wiki中查找,但是英文的wiki咨询更为丰富,见下表

3.编解码学习笔记(三):Mpeg系列——Mpeg 1和Mpeg 2

MPEG视频编码标准

MPEG是Moving Picture Experts Group的简称。这个名字本来的含义是指一个研究视频和音频编码标准的小组。

现在我们所说的MPEG泛指又该小组制定的一系列视频编码标准。该小组于1988年组成,至今已经制定了MPEG-1、MPEG-2、MPEG-3、MPEG-4、MPEG-7等多个标准,MPEG-21正在制定中。

MPEG到目前为止已经制定并正在制定以下和视频相关的标准:

?MPEG-1:第一个官方的视訊音訊压缩标准,随后在Video CD中被采用,其中的音訊压缩的第三级(MPEG-1 Layer 3)简称MP3,成为比较流行的音訊压缩格式。

?MPEG-2:广播质量的视訊、音訊和传输协议。被用于無線數位電視-ATSC、DVB以及ISDB、数字卫星电视(例如DirecTV)、数字有线电视信号,以及DVD视频光盘技术中。

?MPEG-3:原本目标是为高解析度电视(HDTV)设计,随后發現MPEG-2已足夠HDTV應用,故MPEG-3的研發便中止。

?MPEG- 4:2003 年发布的视訊压缩标准,主要是扩展MPEG-1、MPEG-2等標準以支援視訊/音訊物件(video/audio "objects")的編碼、3D內容、低位元率編碼(low bitrate encoding)和數位版權管理(Digital Rights Management),其中第10部分由ISO/IEC和ITU-T联合发布,称为H.264/MPEG-4 Part 10。参见H.264。?MPEG-7:MPEG-7并不是一个视訊压缩标准,它是一个多媒体内容的描述标准。

?MPEG-21:MPEG-21是一个正在制定中的标准,它的目标是为未来多媒体的应用提供一个完整的平台。

媒体codec在于MPEG-1,MPEG-2,MPEG-4,如上图所示。

图中名称解释:在图中VCD,DVD地球人都知道,何为DVB?

DVB:数字视频广播(DVB, Digital VideoBroadcasting),是由―DVB Project‖维护的一系列为国际所承认的数字电视公开标准。DVB系统传输方式有如下几种:

●卫星电视(DVB-S 及DVB-S2)

●有线电视(DVB-C)

●无线电视(DVB-T)

手持地面无线(DVB-H)

这些标准定义了传输系统的物理层与数据链路层。设备通过同步并行接口(synchronous parallel interface, SPI),同步串行接口(synchronous serial interface, SSI),或异步串行接口(asynchronousserial interface, ASI)与物理层交互。数据以MPEG-2传输流的方式传输,并要求符合更严格的限制(DVB-MPEG)。对移动终端即时压缩传输数据的标准(DVB- H)目前正处于测试之中。

这些传输方式的主要区别在于使用的调制方式,因为不同它们应用的频率带宽的要求不同。利用高频载波的DVB-S使用QPSK调制方式,利用低频载波的DVB-C使用QAM-64 调制方式,而利用VHF 及UHF载波的DVB-T使用COFDM调制方式。

除音频与视频传输外,DVB也定义了带回传信道(DVB-RC)的数据通信标准(DVB-DATA)。

DVB的codec,视频为:MPEG-2,MPEG-4 AVC;音频为:MP3,AC-3,AAC,HE-AAC。

MPEG-1

MPEG-1作为ISO/IEC11172正式发布。

MPEG-1较早的视频编码,质量比较差,主要用于CD-ROM 存储视频,国内最为大家熟悉的就是VCD (Video CD),他的视频编码就是采用MPEG-1。它是为CD光盘介质定制的视频和音频压缩格式。一张70分钟的CD光盘传输速率大约在1.4Mbps。而MPEG-1采用了块方式的运动补偿、离散余弦变换(DCT)、量化等技术,并为1.2Mbps传输速率进行了优化。MPEG-1 随后被Video CD采用作为内核技术。MPEG-1的输出质量大约和传统录像机VCR,信号质量相当,这也许是Video CD在发达国家未获成功的原因。

MPEG-1音频分三层,就是MPEG-1 Layer I, II, III,其中第三层协议也就是MPEG- 1 Layer 3,简称MP3。

MP3目前已经成为广泛流传的音频压缩技术。

MPEG-1有下面几个部分:

?第一部分(Part 1):系统;

?第二部分(Part 2):视频;

?第三部分(Part 3):音频;定义level1,level2,level3,并在MPEG-2中定义了扩展。

?第四部分(Part 4):一次性测试;

?第五部分(Part 5):参考软件;

MPEG-1的缺点:

?1个音频压缩系统限于两个通道(立体声)

?没有为隔行扫描视频提供标准化支持,且压缩率差

?只有一个标准化的―profile‖ (约束参数比特流),不适应更高分辨率的视频。MPEG - 1可以支持4k的视频,但难以提供更高分辨率的视频编码并且标识硬件的支持能力。

?支持只有一个颜色空间,4:2:0。

MPEG-2

MPEG-2内容介绍

MPEG-2作为ISO/IEC 13818正式发布,通常用来为广播信号提供视频和音频编码,包括卫星电视、有线电视等。MPEG-2经过少量修改后,也成为DVD产品的内核技术。

MPEG-2有11部分,具体如下:

第一部(Part 1):系统-描述视频和音频的同步和多路技术

正式名称是ISO/IEC 13818-1或ITU-T中的H.222.0

MPEG-2的系统描述部分(第1部分)定义了传输流,它用来一套在非可靠介质上传输数字视频信号和音频信号的机制,主要用在广播电视领域。

定义了两个不同但相关的容器格式,MPEG transport stream和MPEG program stream,也就是图中的TS 和PS。MPEG传输流(TS)为携带可损数字视频和音频,媒体流的开始和结束可以不标识出来,就像广播或者磁带,其中的例子包括ATSC,DVB,SBTVD 和HDV。MPEG-2系统还定义了MPEG节目流(PS),它为以文件为基础的媒体设计一个容器格式,用于硬盘驱动器,光盘和闪存。

MPEG-2 PS(节目流)是为在存储介质保存视频信息而开发的。MPEG-2 TS(传输流)是为在网络传输视频信息而开发的。目前,MPEG-2 TS最广泛地应用是DVB系统。TS流与PS流的区别在于TS流的包结构是固定度的,而PS流的包结构是可变长度。PS包与TS包在结构上的这种差异,导致了它们对传输误码具有不同的抵抗能力,因而应用的环境也有所不同。TS码流由于采用了固定长度的包结构,当传输误码破坏了某一TS包的同步信息时,接收机可在固定的位置检测它后面包中的同步信息,从而恢复同步,避免了信息丢失。而PS包由于长度是变化的,一旦某一PS包的同步信息丢失,接收机无法确定下一包的同步位置,就会造成失步,导致严重的信息丢失。因此,在信道环境较为恶劣,传输误码较高时,一般采用TS码流;而在信道环境较好,传输误码较低时,一般采用PS码流。由于TS码流具有较强的抵抗传输误码的能力,因此目前在传输媒体中进行传输的MPEG-2码流基本上都采用了TS码流的包格。

第二部(Part 2):视频-视频压缩

正式名称是ISO/IEC 13818-2或ITU-T H.262。

提供隔行扫描和非隔行扫描视频信号的压缩编解码器。

MPEG-2的第二部分即视频部分和MPEG-1类似,但是它提供对隔行扫描视频显示模式的支持(隔行扫描广泛应用在广播电视领域)。MPEG-2视频并没有对低位速率(小于1Mbps)进行优化,在3Mbit/s及以上位速率情况下,MPEG-2明显优于MPEG-1。MPEG-2向后兼容,也即是说,所有符合标准的MPEG-2解码器也能够正常播放MPEG-1视频流。

MPEG-2技术也应用在了HDTV传输系统中。MPEG-2 不光运用于DVD-Video ,现在大部分HDTV(高清电视)也采用MPEG-2 编码,分辨率达到了1920x1080。由于MPEG-2 的普及,本来为HDTV 准备的MPEG-3 最终宣告放弃。

MPEG-2视频通常包含多个GOP(GroupOf Pictures),每一个GOP包含多个帧(frame)。帧的帧类(frame type)通常包括I-帧(I-frame)、P-帧(P-frame)和B-帧(B-frame)。其中I-帧采用帧内编码,P-帧采用前向估计,B- 帧采用双向估计。一般来说输入视频格式是25(CCIR标准)或者29.97(FCC)帧/秒。

MPEG-2支持隔行扫描和逐行扫描。在逐行扫描模式下,编码的基本单元是帧。在隔行扫描模式下,基本编码可以是帧,也可以是场(field)。

原始输入图像首先被转换到YCbCr颜色空间。其中Y是亮度,Cb和Cr是两个色度通道。Cb指蓝色色度,Cr指红色色度。对于每一通道,首先采用块分区,然后形成―宏块‖(macroblocks),宏块构成了编码的基本单元。每一个宏块再分区成8x8的小块。色度通道分区成小块的数目取决于初始参数设置。例如,在常用的4:2:0格式下,每个色度宏块只采样出一个小块,所以三个通道宏块能够分区成的小块数目是4+1+1=6个。

对于I-帧,整幅图像直接进入编码过程。对于P-帧和B-帧,首先做运动补偿。通常来说,由于相邻帧之间的相关性很强,宏块可以在前帧和后帧中对应相近的位置找到相似的区域匹配的比较好,这个偏移量作为运动向量被记录下来,运动估计重构的区域的误差被送到编码器中编码。

对于每一个8×8小块,离散余弦变换把图像从空间域转换到频域。得到的变换系数被量化并重新组织排列顺序,从而增加长零的可能性。之后做游程编码(run-length code)。最后作哈夫曼编码(Huffman Encoding)。

I帧编码是为了减少空间域冗余,P帧和B帧是为了减少时间域冗余。

GOP是由固定模式的一系列I帧、P帧、B帧组成。常用的结构由15个帧组成,具有以下形式IBBPBBPBBPBBPBB。GOP中各个帧的比例的选取和带宽、图像的质量要求有一定关系。例如因为B帧的压缩时间可能是I帧的三倍,所以对于计算能力不强的某些实时系统,可能需要减少B帧的比例。

MPEG-2输出的比特流可以是匀速或者变速的。最大比特率,例如在DVD应用上,可达10.4 Mbit/s。如果要使用固定比特率,量化尺度就需要不断的调节以产生匀速的比特流。但是,提高量化尺度可能带来可视的失真效果。比如马赛克现象。

第三部(Part 3):音频-音频压缩

MPEG-2的第三部分定义了音频压缩标准。MPEG-2 BC(Backwards compatible),后向兼容MPEG-1音频。该部分改进了MPEG-1的音频压缩,支持两通道以上的音频,可高达5.1多声道。MPEG-2音频压缩部分也保持了向后兼容的特点(也称为MPEG - 2 BC),允许的MPEG - 1音频解码器解码两个主立体声组件。还定义音频MPEG-1 Layer I,II ,III额外的比特率和采样频率。

例如mp2,是MPEG-1 Audio level 2,标准有:ISO/IEC 11172-3, ISO/IEC 13818-3。MPEG-1Layer II 定义在ISO/IEC 11172-3,也就是MPEG-1的第三部分,在ISO/IEC 13818-3,也就是MPEG-2的第3部分定义扩展。

第四部(Part 4):测试规范

描述测试程序。

第五部(Part 5):仿真软件

描述软件仿真系统。

第六部(Part 6):DSM-CC(Digital Storage Media Commandand Control)扩展

描述DSM-CC(数字存储媒体命令及控制)扩展。

第七部(Part 7):Advanced Audio Coding (AAC)

MPEG-2的第七部分定义了不能向后兼容的音频压缩(也成为MPEG-2 NBC)。也成为MPEG-2 NBC (not-backwards compatible MPEG-1Audio)。该部分提供了更强的音频功能。通常我们所说的MPEG-2 AAC 指的就是这一部分。AAC即Advanced Audio Coding。AAC是比以前的MPEG音频标准的效率,并在某个程度上没有它的前任MPEG-1 Layer3(MP3)复杂,它没有复杂的混合滤波器(hybrid filter bank)。它支持从1到48个通道,采样率从8-96千赫,多渠道,多语种和多节目(multiprogram)能力。AAC也在MPEG-4标准的第3部分描述。

第八部(Part 8):

已取消。

第九部(Part 9):实时接口扩展

实时接口扩展。

第十部(Part 10):DSM-CC一致性扩展

DSM-CC一致性扩展。

第十一部(Part 11):IP

知识产权管理(IPMP)。XML定义在ISO/IEC23001-3。MPEG-2内核技术大约涉及640个专利,这些专利主要集中在20间公司和一间大学。

MPEG- 2 profile和level

MPEG- 2在DVD上的应用

DVD中采用了MPEG-2标准并引入如下技术参数限制:

* 分辨率

o 720 x 480, 704 x 480, 352 x 480, 352 x 240 像素(NTSC制式)

o 720 x 576, 704 x 576, 352 x 576, 352 x 288 像素(PAL制式)

* 纵横比

o 4:3

o 16:9

* 帧率(帧播放速度)

o 59.94 场/秒,23.976帧/秒,29.97帧/秒(NTSC)

o 50 场/秒,25帧/秒(PAL)

* 视频+音频比特率

o 平均最大缓冲区9.8 Mbit/s

o 峰值15 Mbit/s

o 最小值300 Kbit/s

* YUV 4:2:0

* 字幕支持

* 内嵌字幕支持(NTSC only)

* 音频

o LPCM编码:48kHz或96kHz;16或24-bit;最多可达6声道

o MPEG Layer 2 (MP2):48 kHz,可达5.1声道

o 杜比数字-Dolby Digital(DD,也称为AC-3):48 kHz,32-448kbit/s,可达5.1声道o 数字家庭影院系统-Digital Theater Systems (DTS):754 kbit/s或1510 kbit/s

o NTSC制式DVD必须包含至少一道LPCM或Dolby Digital

o PAL制式DVD必须包含至少一道MPEG Layer 2、LPCM或者Dolby Digital

* GOP结构

o 必须为GOP提供串行的头信息

o GOP最大可含帧数目:18 (NTSC) / 15 (PAL)

MPEG- 2在DVB上的应用

DVB-MPEG相关技术参数:

* 必须符合以下一种分辨率:

o 720 × 480 像素,24/1.001,24,30/1.001或30帧/秒

o 640 × 480 像素,24/1.001,24,30/1.001或30帧/秒

o 544 × 480 像素,24/1.001,24,30/1.001或30帧/秒

o 480 × 480 像素,24/1.001,24,30/1.001或30帧/秒

o 352 × 480 像素,24/1.001,24,30/1.001或30帧/秒

o 352 × 240 像素,24/1.001,24,30/1.001或30帧/秒

o 720 × 576 像素,25帧/秒

o 544 × 576 像素,25帧/秒

o 480 × 576 像素,25帧/秒

o 352 × 576 像素,25帧/秒

o 352 × 288 像素,25帧/秒

MPEG- 2和NTSC

必须符合以下一种分辨率:

o 1920 × 1080 像素,最多60帧/秒(1080i)

o 1280 × 720 像素,最多60帧/秒(720p)

o 720 × 576 像素,最多50帧/秒,25帧/秒(576i,576p)

o 720 × 480 像素,最多60帧/秒,30帧/秒(480i,480p)

o 640 × 480 像素,最多60帧/秒

注:1080i按1920×1088像素编码,但是最后8行在显示时抛弃。

对YCbCr的补充资料

YCbCr不是一种绝对色彩空间,是YUV压缩和偏移的版本。右图为UV色版。

Y(Luma,Luminance)视讯,也就是灰阶值。UV 视作表示彩度的C(Chrominance或Chroma)。主要的采样(subsample)格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和YCbCr 4:4:4。YUV的表示法称为A:B:C 表示法:

* 4:4:4 表示完全取样。

* 4:2:2 表示2:1 的水平取样,没有垂直下采样。

* 4:2:0 表示2:1 的水平取样,2:1 的垂直下采样。

* 4:1:1 表示4:1 的水平取样,没有垂直下采样。

最常用Y:UV记录的比重通常1:1 或2:1,DVD-Video 是以YUV 4:2:0 的方式记录,也就是我们俗称的I420,YUV4:2:0 并不是说只有U(即Cb), V(即Cr)一定为0,而是指U:V互相援引,时见时隐,也就是说对于每一个行,只有一个U或者V份量,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。

以上来自wiki资料的整理。

4.编解码学习笔记(四):Mpeg系列——Mpeg 4

在上次对MPEG-2的学习整理中,有一个疑惑,双声道理解,就是左右立体声,但是5.1声道是什么?我们经常看到杜比5.1声道的说法。―0.1‖声道具体指什么?今天去wiki查了一下,相关内容也整理入我们的学习笔记。

本文档资料来源:

?wiki

?https://www.sodocs.net/doc/e49962487.html,/view/190268.htm

?https://www.sodocs.net/doc/e49962487.html,/view/25047.htm

5.1声道

使用杜比数字技术下,最标准常用的是5.1声道设置,但杜比数字容许一系列不同声道的选择。全部可供选择的声道如下列所示:

?单声道(中央)

?双声道立体声(左、右),选择性地交叉应用杜比环回

?三声道立体声(左、中、右)

?双声道立体声加单环回(左、右、环回)

?三声道立体声加单环回(左、中、右、环回)

?四声道环回立体声(左前、右前、左后、右后)

?五声道环回立体声(左前、中、右前、左后、右后)

以上所有这些设置可选择性地使用低频效果和杜比数字EX矩阵编码中加入附加后环绕声道。杜比编码技术是向下兼容的,很多杜比播放器/解码器均备有向下混音作用是发布不同声道至可供使用的扬声器。这包括一些功能例如声音数据通过前扬声器播放(如适用),和当中央扬声器不适用时发布中央频道至左或右扬声器。或当用户只有2.0喇叭时,杜比解码器能把多声道信号混音编码为2.0立体声。

在5.1, 7.1 或其他等文字中,'.1'指的是低频LFE声道。

其实5.1声道就是使用5个喇叭和1个超低音扬声器来实现一种身临其境的音乐播放方式,它是由杜比公司开发的,所以叫做―杜比5.1声道‖。在5.1声道系统里采用左(L)、中(C)、右(R)、左后(LS)、右后(RS)五个方向输出声音,使人产生犹如身临音乐厅的感觉。五个声道相互独立,其中―.1‖ 声道,则是一个专门设计的超低音声道。正是因为前后左右都有喇叭,所以就会产生被音乐包围的真实感。如图所示。

MPEG-4

总体介绍

MPEG-4是一套用于音频、视频信息的压缩编码标准,由国际标准化组织(ISO)和国际电工委员会(IEC)下属的―動態影像专家组‖(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上流媒体、光碟、語音傳送(視訊電話),以及電視廣播。MPEG-4作为ISO/IEC14496正式发布。ISO/IEC 14496-Coding of audio-visual object (AV对象编码)。

为了应对网络传输等环境,传统的MPEG-1/2 已经不能适应,所以促使了MPEG-4 的诞生。与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4是第一个使你由被动变为主动(不再只是观看,允许你加入其中,即有交互性)的动态图像标准,它的另一个特点是其综合性。从根源上说,MPEG-4试图将自然物体与人造物体相溶合(视觉效果意义上的)。MPEG-4的设计目标还有更广的适应性和更灵活的可扩展性。MPEG-4 采用了一系列新技术,来满足在低带宽下传输较高视频质量的需求。DivX,XviD,MS MPEG4 都是采用的MPEG-4 视频编码,除了在DVDRip 上面的应用,3GPP现在也接纳了MPEG-4 作为视频编码方案。

最初MPEG-4的主要目的是用于低比特率下的视频通信,但是作为一个多媒体的编码标准,它的范围最后得到了扩展。在技术方面MPEG-4允许不同的软件/硬件开发商创建多媒体对象来提供更好的适应性、灵活性,为数字电视,动态图像,互联网等业务提供更好的质量。

MPEG-4提供范围从每秒几k比特到每秒数十兆比特的,它具有下面功能:

?改善MPEG-2的编码效率

o MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等。

?提供混合媒体数据(视频,音频,语音)的编码能力

?差错容忍使得内容稳定传输。

o当在传输有误码或丢包现象时,MPEG4受到的影响很小,并且能迅速恢复。

?提供受众视听场景的互动能力,MPEG-4终端用户提供不同的对象支持各种互动要求。

o MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上传、下载、删除等。利用这些工具,用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象组合起来成为合成的多媒体数据。

?MPEG-4对传输数据网是透明的,它可以兼容各种网络。

o MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用,此外,MPEG-4还支持基于内容的的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。

o这些特点无疑会加速多媒体应用的发展,从中受益的应用领域有:因特网多媒体应用;广播电视;交互式视频游戏;实时可视通信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网络等进行的远程数据库业务等。

MPEG-4视频编码核心思想

在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代压缩编码技术,着眼于图像信号的统计特性来设计编码器,属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后分为一系列帧,每一帧图像又分成宏块以进行运动补偿和编码,这种编码方案存在以下缺陷:

?将图像固定地分成相同大小的块,在高压缩比的情况下会出现严重的块效应,即马赛克效应;

?不能对图像内容进行访问、编辑和回放等操作;

?未充分利用人类视觉系统(HVS,Human Visual System)的特性。

MPEG-4则代表了基于模型/对象的第二代压缩编码技术,它充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功能,这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及操作的发展趋势。

AV对象(AVO,AudioVisual Object)是MPEG-4为支持基于内容编码而提出的重要概念。对象是指在一个场景中能够访问和操纵的实体,对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据。在MPEG-4中所见的视音频已不再是过去MPEG-1、MPEG-2中图像帧的概念,而是一个个视听场景(AV场景),这些不同的AV场景由不同的AV对象组成。AV对象是听觉、视觉、或者视听内容的表示单元,其基本单位是原始AV对象,它可以是自然的或合成的声音、图像。原始AV对象具有高效编码、高效存储与传输以及可交互操作的特性,它又可进一步组成复合AV对象。因此MPEG-4标准的基本内容就是对AV对象进行高效编码、组织、存储与传输。AV对象的提出,使多媒体通信具有高度交互及高效编码的能力,AV对象编码就是MPEG-4的核心编码技术。

MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。因此视频对象提取即视频对象分割,是MPEG-4视频编码的关键技术,也是新一代视频编码的研究热点和难点。

MPEG-4不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的存取性,它采用开放的编码系统,可随时加入新的编码算法模块,同时也可根据不同应用需求现场配置解码器,以支持多种多媒体应用。

MPEG-4各部分

MPEG-4由一系列的子标准组成,被称为部,包括以下的部分。对于媒体编解码,重点关注Part2,Part 3, Part 10。

第一部(ISO/IEC 14496-1):系统

描述视訊和音訊的同步以及混合方式(Multiplexing,简写为MUX)。定义了MP4 容器格式, 支持类似DVD 菜单这样的直观和互动特性等。

第二部(ISO/IEC 14496-2):视频

定义了一个对各种视觉信息(包括视訊、静止纹理、计算机合成图形等等)的编解码器。对视訊部分来说,众多‖Profiles‖中很常用的一种是Advanced SimpleProfile (ASP),例如XviD编码就属于MPEG-4Part 2。包括

3ivx, DivX4/Project Mayo, DivX 5, Envivio,ffmpeg/ffds, mpegable, Nero Digital, QuickTime, Sorenson, XviD 等

常见的视频格式, 需要注意的是Divx 3.11, MS MPEG-4, RV9/10, VP6,WMV9 并不属于标准的MPEG-4 标准。

第三部(ISO/IEC 14496-3):音频

定义了一个对各种音訊信号进行编码的编解码器的集合。包括高级音訊编码(Advanced Audio Coding,缩

写为AAC)的若干变形和其他一些音频/语音编码工具。即AAC 音频标准,包括LCAAC, HE AAC 等,支持5.1 声道编码, 可以用更低的码率实现更好的效果(相对于MP3, OGG 等) 。

第四部(ISO/IEC 14496-4):一致性

定义了对本标准其他的部分进行一致性测试的程序。

第五部(ISO/IEC 14496-5):参考软件

提供了用于演示功能和说明本标准其他部分功能的软件。

第六部(ISO/IEC 14496-6):多媒体传输集成框架

即DMIF:Delivery Multimedia IntegrationFramework

第七部(ISO/IEC 14496-7):优化的参考软件

提供了对实现进行优化的例子(这裡的实现指的是第五部分)。

第八部(ISO/IEC 14496-8):在IP网络上传输

定义了在IP网络上传输MPEG-4内容的方式。

第九部(ISO/IEC 14496-9):参考硬件

提供了用于演示怎样在硬件上实现本标准其他部分功能的硬件设计方案。

第十部(ISO/IEC 14496-10):进阶视频编码,也即ITU H.264,常写为H.264/AVC

或称高级视频编码(Advanced Video Coding,缩写为AVC):定义了一个视频编解码器(codec),AVC 和XviD都属于MPEG-4编码,但由于AVC属于MPEG-4Part 10,在技术特性上比属于MPEG-4 Part2的XviD 要先进。另外从技术上讲,它和ITU-T H.264标准是一致的,故全称为MPEG-4 AVC/H.264。

第十一部(ISO/IEC 14496-11):场景描述和应用引擎

可用于多种profile(包括2D和3D版本)的互交互媒体。修订了MPEG-4 Part 1:2001以及Part1的两个修订方案。它定义了应用引擎(交付,生命周期,格式,可下载Java字节代码应用程序的行为),二进制场景格式(BIFS:Binary Format for Scene),可扩展MPEG-4文本格式(一种使用XML描述MPEG-4多媒体内容的文本格式)系统level表述。也就是MPEG-4 Part21中的BIFS,XMT,MPEG-J。

第十二部(ISO/IEC 14496-12):基于ISO的媒体文件格式

定义了一个存储媒体内容的文件格式。

第十三部(ISO/IEC 14496-13):IP

知识产权管理和保护(IPMP for Intellectual Property Management and Protection)拓展。

第十四部(ISO/IEC 14496-14):MPEG-4文件格式

定义了基于第十二部分的用于存储MPEG-4内容的視訊檔案格式。

第十五部(ISO/IEC 14496-15):AVC文件格式

定义了基于第十二部分的用于存储第十部分的视频内容的文件格式。

第十六部(ISO/IEC 14496-16):动画框架扩展

动画框架扩展(AFX : Animation Framework eXtension)。

第十七部(ISO/IEC 14496-17):同步文本字幕格式

尚未完成-2005年1月达成‖最终委员会草案‖,FCD: Final Committee Draft。

第十八部(ISO/IEC 14496-18):字体压缩和流式传输(针对公开字体格式)。

第十九部(ISO/IEC 14496-19):综合用材质流(Synthesized TextureStream)。

第二十部(ISO/IEC 14496-20):简单场景表示

LASeR for Lightweight Scene Representation,尚未完成-2005年1月达成‖最终委员会草案‖,FCD for Final Committee Draft。

第二十一部(ISO/IEC 14496-21):用于描绘(Rendering)的MPEG-J拓展

尚未完成-2005年1月达成―委员会草案‖,CD for Committee Draft)。

Profile和Level

图纸明细栏各种材料标注方法

4产品图样材料标注示例(2006) 简易前言:本文列举了各种材料在工程图纸明细栏中的标注方法。 简易目录: 一、型钢等常用材料; 二、标准件; 三、电镀与化学处理; 四、未注公差; 五、强检要求及关重特性 一、常用材料标注示例 1、型钢 (1)热轧圆钢和方钢 优质钢普通钢 圆(方)钢 20-2 GB/T 702-86 35 GB/T 699-99 圆(方)钢 20-2 GB/T 702-86 Q235A GB/T 700-88 注:1、20表示圆钢直径(方钢边长),2表示直径精度等级(分1,2,3组,1组为最高精度)35、Q235A表示材料牌号 2、GB/T 702-86的规格范围为5.5~250。 (2)冷拉圆钢、方钢和六角钢 冷拉圆(方、六角)钢 11-20GB/T 905-94 35 GB/T 3078-94 注:20表示圆钢直径、方钢边长、六角钢对边长,11表示直径精度级别,35表示材料牌号 2、钢板 (1)按材质优质钢或普通钢、轧制冷或热、规格薄或厚分别标注:

注: 2.0、8等表示钢板厚度,A表示厚度精度等级(分A、B两级,A级为高精度等级,选B级则不标注),Ⅱ表示钢板质量级别,S表示拉延级别(Z-最深、S-深拉延、P-普通)20、Q235A表示材料牌号薄厚分界:薄板0.5 mm~4 mm,厚板4 mm~200 mm GB/T 708-88为冷轧板规格标准(厚度0.2 mm~5.0 mm) (2)不锈钢冷轧钢板: 1.0 GB/T 708-88 钢板 1Cr18Ni9 GB/T 3280-92 (3)深冲压钢板: 油箱等深冲压钢板:牌号:SC1-深冲,SC2、SC3超深冲 标记方法:钢板SC1—1.0GB/T 5213-2001 或用牌号ST14、ST16, 不加GB/T 5213-2001 3、钢丝 按材质优质钢丝或普通钢丝及弹簧钢丝分别标注

音视频技术基本知识一

https://www.sodocs.net/doc/e49962487.html, 音视频技术基本知识一 网易视频云是网易倾力打造的一款基于云计算的分布式多媒体处理集群和专业音视频技术,为客户提供稳定流畅、低时延、高并发的视频直播、录制、存储、转码及点播等音视频的PaaS服务。在线教育、远程医疗、娱乐秀场、在线金融等各行业及企业用户只需经过简单的开发即可打造在线音视频平台。现在,网易视频云总结网络上的知识,与大家分享一下音视频技术基本知识。 与画质、音质等有关的术语 这些术语术语包括帧大小、帧速率、比特率及采样率等。 1、帧 一般来说,帧是影像常用的最小单位,简单的说就是组成一段视频的一幅幅图片。电影的播放连续的帧播放所产生的,现在大多数视频也类似,下面说说帧速率和帧大小。 帧速率,有的转换器也叫帧率,或者是每秒帧数一类的,这可以理解为每一秒的播放中有多少张图片,一般来说,我们的眼睛在看到东西时,那些东西的影像会在眼睛中停留大约十六分之一秒,也就是视频中只要每秒超过15帧,人眼就会认为画面是连续不断的,事实上早期的手绘动画就是每秒播放15张以上的图片做出来的。但这只是一般情况,当视频中有较快的动作时,帧速率过小,动作的画面跳跃感就会很严重,有明显的失真感。因此帧速率最好在24帧及以上,这24帧是电影的帧速率。 帧大小,有的转换器也叫画面大小或屏幕大小等,是组成视频的每一帧的大小,直观表现为转换出来的视频的分辨率的大小。一般来说,软件都会预置几个分辨率,一般为320×240、480×320、640×360、800×480、960×540、1280×720及1920×1080等,当然很多转换器提供自定义选项,这里,不得改变视频长宽比例。一般根据所需要想要在什么设备上播放来选择分辨率,如果是转换到普通手机、PSP等设备上,视频分辨率选择与设备分辨率相同,否则某些设备可能会播放不流畅,设备分辨率的大小一般都可以在中关村在线上查到。 2、比特率 比特率,又叫码率或数据速率,是指每秒传输的视频数据量的大小,音视频中的比特率,是指由模拟信号转换为数字信号的采样率;采样率越高,还原后的音质和画质就越好;音视频文件的体积就越大,对系统配置的要求也越高。 在音频中,1M以上比特率的音乐一般只能在正版CD中找到,500K到1M的是以APE、FLAC等为扩展名的无损压缩的音频格式,一般的MP3是在96K到320K之间。目前,对大多数人而言,对一般人而言192K就足够了。 在视频中,蓝光高清的比特率一般在40M以上,DVD一般在5M以上,VCD一般是在1M 以上。(这些均是指正版原盘,即未经视频压缩的版本)。常见的视频文件中,1080P的码率一般在2到5M之间,720P的一般在1到3M,其他分辨率的多在一M一下。 视频文件的比特率与帧大小、帧速率直接相关,一般帧越大、速率越高,比特率也就越大。当然某些转换器也可以强制调低比特率,但这样一般都会导致画面失真,如产生色块、色位不正、出现锯齿等情况。

JPEG图像的编解码实现

毕业论文论文题目(中文)JPEG图像的编解码实现 论文题目(外文)Encoding and decoding of JPEG image

摘要 JPEG是一种十分先进的图像压缩技术,它用有损压缩方式去除冗余的图像数据,在获得极高的压缩率的同时能展现十分丰富生动的图像。本文设计和实现一个JPEG图像编解码器来进行图像转换,利用离散余弦变换、熵编码、Huffman编码等图像压缩技术将BMP图像转换成JPEG图像,即进行图像的压缩。验证JPEG压缩编码算法的可行性。通过比对图像压缩前后实际效果,探讨压缩比,峰值信噪比等评价图像数据压缩程度及压缩质量的关键参数,对JPEG 压缩编码算法的实用性和优越性进行研究。 关键词:JPEG;编码;解码;图像压缩

Abstract JPEG is a very advanced image compression technology, it uses lossy compression to remove redundant image data, in obtaining a very high compression rate can show a very rich and vivid image. In this project, a JPEG image codec is designed and implemented to transform image, using discrete cosine transform, entropy coding, Huffman coding and other image compression techniques to convert BMP images into JPEG images. Verifies the feasibility of JPEG compression coding algorithm. Through the comparison of the actual effect of image compression, the key parameters of compression ratio, peak Snr, and the compression quality of image data are discussed, and the practicability and superiority of JPEG compression coding algorithm are researched. Key words: JPEG; encoding; decoding; image compression

机械图纸解析,看懂了它,所有的图纸都能轻松看懂(干货)

机械图纸解析,看懂了它,所有的图纸都能轻松看懂(干货)1.纸幅面按尺寸大小可分为5种,图纸幅面代号分别为A0、A1、A2、A3、A4。 图框右下角必须要有一标题栏,标题栏中的文字方向为与看图方向一致。 2.图线的种类有粗实线、细实线、波浪线、双折线、虚线、细点划线、粗点划线、 双点划线等八类。 3.图样中,机件的可见轮廓线用粗实线画出,不可见轮廓线用虚线画出,尺寸线和 尺寸界线用细实线画出来,对称中心线和轴线用细点划线画出。虚线、细实线和细 点划线的图线宽度约为粗实线的1/3。 4.比例是指图中图形尺寸与实物尺寸之比。 5.比例1:2是指实物尺寸是图形尺寸的2倍,属于缩小比例。 6.比例2:1是指图形尺寸是实物尺寸的2倍,属于放大比例。 7.在画图时应尽量采用原值比例的比例,需要时也可采用放大或缩小的比例,其中1:2为缩小比例,2:1为放大比例无论采用那种比例图样上标注的应是机件的实 际尺寸。 8.图样中书写的汉字、数字和字母,必须做到字体工整,笔画清楚,间隔均匀,排 列整齐,汉字应用长仿宋体书写。

9.标注尺寸的三要素是尺寸界限、尺寸线、尺寸数字。 10.尺寸标注中的符号:R表示圆半径,ф表示圆直径,Sф表示球直径。 11.图样上的尺寸是零件的实际尺寸,尺寸以毫米为单位时,不需标注代号或名称。 12.标准水平尺寸时,尺寸数字的字头方向应向上;标注垂直尺寸时,尺寸数字的 字头方向应朝左。角度的尺寸数字一律按水平位置书写。当任何图线穿过尺寸数字时都必须断开。 13.斜度是指斜线对水平线的倾斜程度,用符号∠表示,标注时符号的倾斜方向应 与所标斜度的倾斜方向一致。所标锥度方向一致。 14.符号“∠1:10”表示斜度1:10,符号“ 1:5”表示锥度1:5。 15.平面图形中的线段可分为已知线段、中间线段、连接线段三种。它们的作图顺 序应是先画出已知线段,然后画中间线段,最后画连接线段。 16.已知定形尺寸和定位尺寸的线段叫已知线段;有定形尺寸,但定位尺寸不全的 线段叫中间线段;只有定形尺寸没有定位尺寸的线段叫连接线段。

机械制图标注常用符号大全

机械制图标注常用符号

序号 符号名称 符号绘制标准 应用示例 1 GB/T 1182-2008 基准符号。 涂黑三角形及中轴线可任意变换位置,方框和字母只允许水平放置不允许歪斜;方框外边的连线也只允许在水平或铅垂两个方向画出。 2 GB/T 4458.4-2003; 标注正方形结构尺寸时在尺寸前面加注正方形符号。 高度h=3.5mm 3 GB/T 4458.4-2003; 标注弧长时在尺寸前面加注弧长符号。 高度h=R=3.5mm 4 GB/T 4458.4-2003;GB/T 16675.2-1996 尺寸注法; 沉孔或锪平符号。 高度h=3.5mm 5 GB/T 4458.4-2003; GB/T 16675.2-1996 尺寸注法; 沉孔或锪平深度符号。 高度h=3.5mm

6GB/T 4458.4-2003; GB/T 16675.2-1996 尺寸注法; 埋头孔符号。 高度h=3.5mm 机械制图尺寸标注常用标准符号 序号符号名称符号绘制标准应用示例7GB/T 15754-1995 锥度符号或莫氏锥 度注法。 高度h=3.5mm 8JB/T 5061-2006 定位支撑符号。 高度h=3.5mm 9JB/T 5061-2006 辅助支撑符号。 高度h=3.5mm 10JB/T 5061-2006 辅助支撑符号。 高度h=5mm

11GB/T 4459.5-1999 中心孔符号。 高度h=3.5mm; 高度H1=5mm。 12JB/T 8555-2008 热 处理技术要求在零 件图样上的表示方 法。粗糙度符号的三 角形部分为测量点 符号。可随图形进行 缩放。 汇编人:质管办标准化管理员郑家贵2011年8月25日 机械制图基础知识 一、.图线GB/T 4457.4-2002 GB/T 17450-1998

(完整)流媒体传输协议及音视频编解码技术

1.1音视频编解码技术 1.1.1 MPEG4 MPEG全称是Moving Pictures Experts Group,它是“动态图象专家组”的英文缩写,该专家组成立于1988年,致力于运动图像及其伴音的压缩编码标准化工作,原先他们打算开发MPEG1、MPEG2、MPEG3和MPEG4四个版本,以适用于不同带宽和数字影像质量的要求。 目前,MPEG1技术被广泛的应用于VCD,而MPEG2标准则用于广播电视和DVD等。MPEG3最初是为HDTV开发的编码和压缩标准,但由于MPEG2的出色性能表现,MPEG3只能是死于襁褓了。MPEG4于1999年初正式成为国际标准。它是一个适用于低传输速率应用的方案。与MPEG1和MPEG2相比,MPEG4更加注重多媒体系统的交互性和灵活性MPEG1、MPEG2技术当初制定时,它们定位的标准均为高层媒体表示与结构,但随着计算机软件及网络技术的快速发展,MPEG1、MPEG2技术的弊端就显示出来了:交互性及灵活性较低,压缩的多媒体文件体积过于庞大,难以实现网络的实时传播。而MPEG4技术的标准是对运动图像中的内容进行编码,其具体的编码对象就是图像中的音频和视频,术语称为“AV对象”,而连续的AV对象组合在一起又可以形成AV场景。因此,MPEG4标准就是围绕着AV对象的编码、存储、传输和组合而制定的,高效率地编码、组织、存储、传输AV 对象是MPEG4标准的基本内容。 在视频编码方面,MPEG4支持对自然和合成的视觉对象的编码。(合成的视觉对象包括2D、3D动画和人面部表情动画等)。在音频编码上,MPEG4可以在一组编码工具支持下,对语音、音乐等自然声音对象和具有回响、空间方位感的合成声音对象进行音频编码。 由于MPEG4只处理图像帧与帧之间有差异的元素,而舍弃相同的元素,因此大大减少了合成多媒体文件的体积。应用MPEG4技术的影音文件最显著特点就是压缩率高且成像清晰,一般来说,一小时的影像可以被压缩为350M左右的数据,而一部高清晰度的DVD电影, 可以压缩成两张甚至一张650M CD光碟来存储。对广大的“平民”计算机用户来说,这就意味着, 您不需要购置DVD-ROM就可以欣赏近似DVD质量的高品质影像。而且采用MPEG4编码技术的影片,对机器硬件配置的要求非常之低,300MHZ 以上CPU,64M的内存和一个8M显存的显卡就可以流畅的播放。在播放软件方面,它要求也非常宽松,你只需要安装一个500K左右的MPEG4 编码驱动后,用WINDOWS 自带的媒体播放器就可以流畅的播放了 AV对象(AVO,Audio Visual Object)是MPEG-4为支持基于内容编码而提出的重要概念。对象是指在一个场景中能够访问和操纵的实体,对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据。在MPEG-4中所见的音视频已不再是过去MPEG-1、MPEG-2中图像帧的概念,而是一个个视听场景(AV场景),这些不同的AV场景由不同的AV对象组成。AV对象是听觉、视觉、或者视听内容的表示单元,其基本单位是原始AV对象,它可以是自然的或合成的声音、图像。原始AV对象具有高效编码、高效存储与传输以及可交互性的特性,它又可进一步组成复合AV对象。因此MPEG-4标准的基本内容就是对AV对象进行高效编码、组织、存储与传输。AV对象的提出,使多媒体通信具有高度交互及高效编码的能力,AV对象编码就是MPEG-4的核心编码技术。 MPEG-4不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的存取性,它采用开放的编码系统,可随时加入新的编码算法模块,同时也可根据不同应用需求现场配置解码器,以支持多种多媒体应用 1.1.2 H264 H.264是由ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)联合组建的联合视频组(JVT:joint video team)提出的一个新的数字视频编码标准,

jpeg编解码过程详解海王博客园

JPEG编解码过程详解- 海王- 博客园 JPEG(Joint Photographic Experts Group)是联合图像专家小组的英文缩写。它由国际电话与电报咨询委员会CCITT(The International Telegraph and Telephone Consultative Committee)与国际标准化组织ISO于1986年联合 成立的一个小组,负责制定静态数字图像的编码标准。 小组一直致力于标准化工作,开发研制出连续色调、多级灰度、静止图像的数字图像压缩编码方法,即JPEG 算法。JPEG算法被确定为国际通用标准,其适用范围广泛,除用于静态图像编码外,还推广到电视图像序列的帧 内图像压缩。而用JPEG算法压缩出来的静态图片文件称为JPEG文件,扩展名通常为*.jpg、*.jpe*.jpeg。 JPEG专家组开发了两种基本的压缩算法、两种数据编码方法、四种编码模式。具体如下: 压缩算法: l 有损的离散余弦变换(Discrete Cosine Transform,DCT);l 无损的预测技术压缩。 数据编码方法: l 哈夫曼编码; l 算术编码; 编码模式:

l 基于DCT顺序模式:编/解码通过一次扫描完成; l 基于DCT递进模式:编/解码需要多次扫描完成,扫描效果从粗糙到精细,逐级递进; l 无损模式:基于DPCM,保证解码后完全精确恢复到原图像采样值; l 层次模式:图像在多个空间多种分辨率进行编码,可以根据需要只对低分辨率数据作解码,放弃高分辨率信息。 在实际应用中,JPEG图像使用的是离散余弦变换、哈夫曼编码、顺序模式。 JPEG压缩编码算法的主要计算步骤如下: (0) 8*8分块。 (1) 正向离散余弦变换(FDCT)。 (2) 量化(quantization)。 (3) Z字形编码(zigzag scan)。 (4) 使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码。 (5) 使用行程长度编码(RLE)对交流系数(AC)进行编码。 (6) 熵编码。 笔者在实践过程中查阅了大量的资料,发现大多数书籍资料和网上资料都是从编码角度分析JPEG的编/解码方式,

JPEG编码过程详解

JPEG(Joint Photographic Experts Group)是联合图像专家小组的英文缩写。它由国际电话与电报咨询委员会 CCITT(The International Telegraph and Telephone Consultative Committee)与国际标准化组织ISO于1986年联合 成立的一个小组,负责制定静态数字图像的编码标准。 小组一直致力于标准化工作,开发研制出连续色调、多级灰度、静止图像的数字图像压缩编码方法,即JPEG 算法。JPEG算法被确定为国际通用标准,其适用范围广泛,除用于静态图像编码外,还推广到电视图像序列的帧 内图像压缩。而用JPEG算法压缩出来的静态图片文件称为JPEG文件,扩展名通常为*.jpg、*.jpe*.jpeg。 JPEG专家组开发了两种基本的压缩算法、两种数据编码方法、四种编码模式。具体如下: 压缩算法: ● 有损的离散余弦变换(Discrete Cosine Transform,DCT); ● 无损的预测技术压缩。 数据编码方法: ● 哈夫曼编码; ● 算术编码; 编码模式: ● 基于DCT顺序模式:编/解码通过一次扫描完成; ● 基于DCT递进模式:编/解码需要多次扫描完成,扫描效果从粗糙到精细, 逐级递进; ● 无损模式:基于DPCM,保证解码后完全精确恢复到原图像采样值; ● 层次模式:图像在多个空间多种分辨率进行编码,可以根据需要只对低 分辨率数据作解码,放弃高分辨率信息。 在实际应用中,JPEG图像使用的是离散余弦变换、哈夫曼编码、顺序模式。JPEG压缩编码算法的主要计算步骤如下: (0) 8*8分块。 (1) 正向离散余弦变换(FDCT)。 (2) 量化(quantization)。 (3) Z字形编码(zigzag scan)。 (4) 使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码。 (5) 使用行程长度编码(RLE)对交流系数(AC)进行编码。 (6) 熵编码。 笔者在实践过程中查阅了大量的资料,发现大多数书籍资料和网上资料都是从编码角度分析JPEG的编/解码方式, 并且都只是介绍编码过程中的主要方法。所以,本文从解码角度详细分析JPEG的编/解码过程,并且加入许多笔

数字音视频编解码技术标准工作组知识产权政策

数字音视频编解码技术标准工作组知识产权政策

————————————————————————————————作者:————————————————————————————————日期:

数字音视频编解码技术标准工作组知识产权政策 (2004年9月12日第十次工作会议通过实施) (2008年3月29日第二十四次工作会议修订) 第一章、总则 第一条本知识产权政策文件(“知识产权政策”)规定了中国数字音视频编解码技术标准工作组(“工作组”)的与制订A VS技术标准的整个过程及其所产生的标准文 档相关的知识产权的管理规则。 第二条通过签署A VS会员协议,会员书面承诺该会员及其关联者及其工作组成员同意并遵守本知识产权政策的条款。 第三条本知识产权政策是A VS会员协议的必要组成部分,并通过引用纳入会员协议。 第二章、定义 第四条对于在本知识产权政策中使用并且在A VS章程、A VS会员协议和A VS章程细则中已有定义的词语,其含义应遵从有关文件中的定义。以下词语在本知识产 权政策中定义为以下含义: 1、“符合部分”仅指有关产品或服务中实施并符合最终A VS 标准的所有相关规范性要求的特定部分,这些规范性要求应当 在最终A VS标准中明确公开,并且其目的是为了使产品或服 务能够实现该最终AVS标准所定义的解码、编码、发送数字 媒体或识别和实施权利管理。 2、“必要权利要求”是指根据授权或公布专利的所在国法律, 被最终A VS标准的符合部分不可避免地侵权的该专利中的某 一权利要求,且仅限于该权利要求。 专利的某一权利要求被不可避免地侵权,是指该侵权不可能在 实施最终A VS标准时通过采用另一个技术上可行的不侵权的 实施方式予以避免。 必要权利要求不包括,并且许可也不适用于:(1)不符合上文 规定的其他权利要求,即使该权利要求包含在同一件专利中; (2)在最终的A VS标准文档中引用或以参考方式包括在内的 其他标准中涉及的权利要求;(3)制造或使用符合最终AVS 标准文档的任何产品、服务及其部分时可能必要,但没有明确 地在该标准文档中描述的实现技术。 3、“专利”是指许可方或其关联者拥有的或者在无需向非关联 第三方付费的情况下有权许可的,在任何国家授权的任何专 利、可执行的发明证书、授权的实用新型、或公布提请异议的 任何可执行的专利申请或实用新型申请,但不包括外观设计专 利和外观设计登记。 4、“规范性参考文件”是指并非由工作组制定而是通过引用包

JPEG图像压缩原理

JPEG编码 JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。和相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目前静态图象中压缩比最高的。我们给出具体的数据来对比一下。例图采用Windows95目录下的Clouds.bmp,原图大小为640*480,256色。用工具SEA(version1.3)将其分别转成24位色BMP、24位色JPEG、GIF(只能转成256色)压缩格式、24位色TIFF压缩格式、24位色TGA压缩格式。得到的文件大小(以字节为单位)分别为:921,654,17,707,177,152,923,044,768,136。可见JPEG比其它几种压缩比要高得多,而图象质量都差不多(JPEG处理的颜色只有真彩和灰度图)。 正是由于JPEG的高压缩比,使得它广泛地应用于多媒体和网络程序中,例如HTML语法中选用的图象格式之一就是JPEG(另一种是GIF)。这是显然的,因为网络的带宽非常宝贵,选用一种高压缩比的文件格式是十分必要的。 JPEG有几种模式,其中最常用的是基于DCT变换的顺序型模式,又称为基线系统(Baseline),以下将针对这种格式进行讨论。 1.JPEG的压缩原理 JPEG的压缩原理其实上面介绍的那些原理的综合,博采众家之长,这也

正是JPEG有高压缩比的原因。其编码器的流程为: 图9.3 JPEG编码器流程 解码器基本上为上述过程的逆过程: 图9.4 解码器流程 DCT 下面对正向离散余弦变换(FDCT)变换作几点说明。 (1)对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,如图所示,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。 (2)DCT变换使用下式计算: 它的逆变换使用下式计算:

JPEG文件编解码详解

JPEG文件编/解码详解 cat_ng 猫猫 JPEG(Joint Photographic Experts Group)是联合图像专家小组的英文缩写。它由国际电话与电报咨询委员会 CCITT(The International Telegraph and Telephone Consultative Committee)与国际标准化组织ISO 于1986年联合 成立的一个小组,负责制定静态数字图像的编码标准。 小组一直致力于标准化工作,开发研制出连续色调、多级灰度、静止图像的数字图像压缩编码方法,即JPEG 算法。JPEG算法被确定为国际通用标准,其适用范围广泛,除用于静态图像编码外,还推广到电视图像序列的帧 内图像压缩。而用JPEG算法压缩出来的静态图片文件称为JPEG文件,扩展名通常为*.jpg、*.jpe*.jpeg。 JPEG专家组开发了两种基本的压缩算法、两种数据编码方法、四种编码模式。具体如下: 压缩算法: ● 有损的离散余弦变换(Discrete Cosine Transform,DCT); ● 无损的预测技术压缩。 数据编码方法: ● 哈夫曼编码; ● 算术编码; 编码模式: ● 基于DCT顺序模式:编/解码通过一次扫描完成; ● 基于DCT递进模式:编/解码需要多次扫描完成,扫描效果从粗糙到精细, 逐级递进; ● 无损模式:基于DPCM,保证解码后完全精确恢复到原图像采样值;

层次模式:图像在多个空间多种分辨率进行编码,可以根据需要只对低分辨率数据作解码,放弃高分辨率信息。 在实际应用中,JPEG图像使用的是离散余弦变换、哈夫曼编码、顺序模式。 JPEG压缩编码算法的主要计算步骤如下: (0) 8*8分块。 (1) 正向离散余弦变换(FDCT)。 (2) 量化(quantization)。 (3) Z字形编码(zigzag scan)。 (4) 使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码。 (5) 使用行程长度编码(RLE)对交流系数(AC)进行编码。 (6) 熵编码。 笔者在实践过程中查阅了大量的资料,发现大多数书籍资料和网上资料都是从编码角度分析JPEG的编/解码方式, 并且都只是介绍编码过程中的主要方法。所以,本文从解码角度详细分析JPEG的编/解码过程,并且加入许多笔 者实践过程中遇到的问题和解决方法,希望从另一个角度说明问题,以更好帮助读者结合其他资料解决问题。 不过,介绍解码过程之前,首先要了解JPEG文件中数据的存储格式。 一、JPEG文件格式介绍 JPEG文件使用的数据存储方式有多种。最常用的格式称为JPEG文件交换格式(JPEG File Interchange Format,JFIF )。而JPEG文件大体上可以分成两个部分:标记码(Tag)和压缩数据。

以太网音视频编解码器

TVSENSE YZX-400EN/DE 网络音视频编解码器 用 户 手 册 南京易之讯科技有限公司 二○○六年四月

TVSENSE 视频编解码器使用手册 目录 一、产品简介 (3) 技术特点 (3) 二、产品结构 (4) 2.1内部布置: (4) 2.2外形尺寸: (4) 三、技术指标 (5) 四、接口说明 (6) 4.1前面板 (6) 4.2后面板 (6) 4.3接口指示说明: (6) 五、接线说明 (7) 5.1网络接线 (7) 5.2音频接线 (7) 5.3视频接线 (7) 5.4控制接线 (8) 六、串口定义 (9) 6.1 串口定义: (9) 6.2 内部跳线: (10) 七、调试软件 (11) 7.1硬件准备: (11) 7.2硬件连接: (11) 7.3软件准备: (11) 7.4设备IP配置DevNetSet (12) 7.5设备管理DevManager (13) 7.5.1设备配对 (13) 7.5.2串口配置 (15) 7.6网络浏览DevVideoBrowser (16) 八.典型应用 (17) 九、产品装箱清单 (18)

序言 ●简介 本音视频编解码器是为适应基于TCP/IP协议和10M/100M以太网传输通道而设计的,采用MPEG2压缩方式,具有强大的即时图像捕捉和图像压缩功能。它利用以太网通道实现实时视频音频传输,并同时提供RS232/485串行数据通信端口,满足远程视频监控、视频会议等系统需要。 注意事项 本说明书提供给用户安装调试、参数设置及操作使用的有关注意事项,务请妥善保管,并为了您的正确、高效地使用本产品,请仔细阅读本说明书。 一、产品简介 技术特点 ●基于MPC860T+OSE(RTOS)的嵌入式设计; ●采用最新MPEG-2优化技术,最小带宽支持1024Kbps; ●以太网传输端到端延时小于180ms; ●提供10M/100M以太网接口,带宽适应范围宽,支持多点对多点同时访问; ●具备同时发送单播包及组播包功能,可支持临时用户加入访问,同时在某些不支持组播功 能的特殊网段中通过单播方式访问; ●双向语音对讲,支持回音抵消功能,独特的以太网方式下双向语音对话设计,适合监控中 心与前端对讲; ●提供两路RS-485/232双向透明串口,可用于远端设备控制及监控数据采集; ●可选集中式机箱,提高集成度; ●与多家同类设备实现互联互通,适应大规模联网监控; ●在各种高温、高尘等恶劣环境下,产品能够正常工作; ●提供相关系统软件,实现网络浏览、虚拟矩阵等功能; ●提供应用程序开发接口(包括WINAPI和ActiveX),方便进行二次开发; ●产品设计生产符合ISO9001标准。

各种音视频编解码学习详解 h264

各种音视频编解码学习详解h264 ,mpeg4 ,aac 等所有音视频格式 编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫―天下维客‖。wiki的中文还是很不错的,但是阅读后建议再阅读英文。 我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹。 基本概念 编解码 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。 容器 很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、a vi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。 视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。 参数介绍 采样率 采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称―位速率‖)相混淆。

JPEG图像格式详解

JPEG图像格式详解 JPEG 压缩简介 ------------- 1. 色彩模型 JPEG 的图片使用的是 YCrCb 颜色模型, 而不是计算机上最常用的 RGB. 关于色彩模型, 这里不多阐述. 只是说明, YCrCb 模型更适合图形压缩. 因为人眼对图片上的亮度 Y 的变化远比色度 C 的变化敏感. 我们完全可以每个点保存一个 8bit 的亮度值, 每 2x2 个点保存一个 Cr Cb 值, 而图象在肉眼中的感觉不会起太大的变化. 所以, 原来用 RGB 模型, 4 个点需要 4x3=12 字节. 而现在仅需要 4+2=6 字节; 平均每个点占 12bit. 当然 JPEG 格式里允许每个点的 C 值都记录下来; 不过 MPEG 里都是按 12bit 一个点来存放的, 我们简写为 YUV12. [R G B] -> [Y Cb Cr] 转换 ------------------------- (R,G,B 都是 8bit unsigned) | Y | | 0.299 0.587 0.114 | | R | | 0 | | Cb | = |- 0.1687 - 0.3313 0.5 | * | G | + |128| | Cr | | 0.5 - 0.4187 - 0.0813| | B | |128| Y = 0.299*R + 0.587*G + 0.114*B (亮度) Cb = - 0.1687*R - 0.3313*G + 0.5 *B + 128 Cr = 0.5 *R - 0.4187*G - 0.0813*B + 128 [Y,Cb,Cr] -> [R,G,B] 转换 ------------------------- R = Y + 1.402 *(Cr-128) G = Y - 0.34414*(Cb-128) - 0.71414*(Cr-128) B = Y + 1.772 *(Cb-128) 一般, C 值 (包括 Cb Cr) 应该是一个有符号的数字, 但这里被处理过了, 方法是加上了 128. JPEG 里的数据都是无符号 8bit 的. 2. DCT (离散余弦变换) JPEG 里, 要对数据压缩, 先要做一次 DCT 变换. DCT 变换的原理, 涉及到数学知识, 这里我们不必深究. 反正和傅立叶变换(学过高数的都知道) 是差不多了. 经过这个变换, 就把图片里点和点间的规律呈现出来了, 更方便压缩.JPEG 里是对每 8x8

浅谈H.265视频编解码技术标准的概念

浅谈H.265视频编解码技术标准的概念 于国际电联ITU-T 和国际标准化组织ISO,ITU 的H.26×系列视频压缩标 准经过了H.261、H.263,h.263+这样一个演进过程。而ISO 的视频压缩标准是MPEG 系列,从MPEG1、MEPG2 到MPEG4,之后两个标准化组合走向合作,成立了JVT,推出了在当前最有效的视频压缩标准,H.264/AVC。从H.264 标 准发布到如今已经有五年时间,在这五年中H.264 的应用范围不断扩展,成熟 度不断提高,而ITU—T 在H.264 取得初步成功的时候,ITU—T 的视频编码特别小组VCEG 于2005 年就对视频编码技术提出了更长远的设想。并规划在技 术成熟时推出新一代的视频编码标准H.265。2012 年8 月,爱立信公司推出了首款H.265 编解码器,而在仅仅六个月之后,国际电联(ITU)就正式批准通过了HEVC/H.265 标准,标准全称为高效视频编码(HighEfficiencyVideoCoding),相较于之前的H.264 标准有了相当大的改善。 提出H.265 标准.是为了给音视频服务提供更好的视频编码方法。音视频服 务包括会话式和非会话式音视频服务。其中会话式音视频服务包括视频会议和 可视电话,非会话式音视频服务包括流媒体、广播、文档下载、媒体存储/播放 和数字摄像机。H.265 标准围绕着现有的视频编码标准H.264,保留原来的某 些技术,同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延迟和算法复杂度之间的关系,达到最优化设置。具体的研究 内容包括:提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的迟延、减 少信道获取时间和随机接入迟延、降低复杂度等。H.264 由于算法优化,可以 低于1Mbps 的速度实现标清数字图像传送;H.265 则可以实现利用1~2Mbps 的传输速度传送720P(分辨率1280×720)普通高清音视频传送。 事实上,H.265 视频压缩技术早在H.264 发布后不久,即进行了关键技术领

各种音视频编解码学习详解

各种音视频编解码学习详解 编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫―天下维客‖。wiki的中文还是很不错的,但是阅读后建议再阅读英文。 我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹。 基本概念 编解码 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。 容器 很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、avi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。 视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。 参数介绍 采样率 采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称―位速率‖)相混淆。 采样定理表明采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz。换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。 对于语音采样: ?8,000 Hz - 电话所用采样率, 对于人的说话已经足够 ?11,025 Hz ?22,050 Hz - 无线电广播所用采样率 ?32,000 Hz - miniDV 数码视频camcorder、DAT (LP mode)所用采样率 ?44,100 Hz - 音频CD, 也常用于MPEG-1 音频(VCD, SVCD, MP3)所用采样率

建筑图纸符号大全

一、建筑图纸符号大全 @表示钢筋间距 Φ表示钢筋型号,CAD快捷键一览 创建三维阵列3A 创建三维面3F 在三维空间创建由直线段组成的多段线3P 在二维和三维空间中将某对象与其他对象对齐AL 加载AutoLISP、ADS 和ARX 应用程序AP 创建圆弧A 计算对象或定义区域的面积和周长AA 创建按指定方式排列的多重对象拷贝AR 执行外部数据库命令的管理功能AAD 输出选择对象的链接信息AEX 管理对象和外部数据库之间的链接ALI 显示并编辑表数据并创建链接和选择集ARO 从链接到文字选择集和图形选择集的行中创建选择集ASE 执行结构查询语言(SQL) 语句ASQ 创建属性定义-AT 改变不依赖于块定义的属性信息-ATE 用图案填充封闭区域H或BH 根据选定对象创建块定义-B

用对话框定义块B 用封闭区域创建面域或多段线BO (使用命令行)用封闭区域创建面域或多段线-BO 部分删除对象或把对象分解为两部分BR 给对象加倒角CHA 修改现有对象的特性-CH 根据圆心和直径或半径绘制圆C 复制对象CO或CP 创建属性定义AT 编辑单个块的可变属性ATE 修改对象的颜色、图层、线型和厚度CH 设置新对象的颜色COL 编辑文字和属性定义ED 显示夹点并设置颜色GR 创建并修改标注样式D 插入块或另一图形I 控制现有对象的特性MO 修改对象名称REN 设置绘图辅助工具RM 设置对象选择模式SE 管理已定义的用户坐标系UC 选择预置用户坐标系UCP

控制坐标和角度的显示格式及精度UN 创建和恢复视图V 设置三维观察方向VP 创建对齐线性标注DAL或DIMALI 创建角度标注DAN或DIMANG 从前一个或选择的标注的第一尺寸界线处连续标注DBA或DIMBASE 创建圆和圆弧的圆心标记或中心线DCE 从前一个或选择的标注的第二尺寸界线处连续标注DCO或DIMCONT 创建圆和圆弧的直径标注DDI或DIMDIA 编辑标注DED或DIMED 创建线性尺寸标注DLI或DIMLIN 创建坐标点标注DOR或DIMORD 替换标注系统变量DOV或DIMOVER 创建圆和圆弧的半径尺寸标注DRA或DIMRAD 在命令行创建和修改标注样式DST或DIMSTY 移动和旋转标注文字DIMTED 测量两点之间的距离和角度DI 将点对象或块沿对象的长度或周长等间隔排列DIV 绘制填充的圆和环DO 修改图像和其他对象的显示顺序DR 打开鸟瞰视图窗口AV 输入文字时在屏幕上显示DT

相关主题