搜档网
当前位置:搜档网 › DOS环境下播放WAV语音

DOS环境下播放WAV语音

DOS环境下播放WAV语音
DOS环境下播放WAV语音

第2卷第5期辽宁高职学报 Vol. 2, No. 5 2000年 10月 LIAONING HIGHER VOCATIONAL TECHNICAL INSTITUTE JOURNAL Oct. 2000 文章编号:1009—7600(2000)05—0067—02

DOS环境下播放W A V语音

文件的程序设计

李东生,王震

(抚顺职业技术学院计算机系,辽宁抚顺:113006)

摘要:在DOS环境下,实现了对Windows WAV语音文件播放的程序设计。利用脉宽调制方法可使PC机的扬声器能够直接在DOS环境下播放W A V语音文件,产生的语音效果较为逼真。

关键词:W A V语音文件;扬声器;8253定时器;语音信号

中图分类号:TP 31 文献标积码:A

引言

W A V语音文件是Windows操作系统下提供的一种数字语音文件,是由数字语音信号构成。

W A V语音文件的播放一般在Windows的应用程序中较易实现,然而要在DOS环境下直接用PC

机的扬声器来播放,就需要处理好数字语音信号与模拟信号之间的转换。目前驱动扬声器发声通

常是利用8253定时器产生不同频率的方波,驱动扬声器工作,产生该频率的声音。这种方法只能模拟简单的声音,对声音模仿能力不强。本文利用脉宽调制方法很好地解决这个问题。所以,在

DOS环境下设计能够直接用扬声器播放WAV语音文件的程序,对丰富在该环境下的开发应用有实际意义。

1.实现原理

通常人的听觉能辨别的信号频率范围为4000~8000H Z。实践证明,微机采用8KH Z的数字语

言采样信号频率,且采取8位量化就可以满足模拟各种语音效果的目的。我们知道扬声的工作过

程是这样的:61H是扬声器的驱动端口地址,以Bit0和Bitl来控制扬声器发声。当Bit0置于1

或0时,扬声器纸盆向外运动或静止;由于纸盆运行速度远远低于微机CPU的指令速度,并且纸盆本身又具有惯性,所以当Bitl置1或0时,纸盆不能马上达到最大或静止位置,呈现滞后状态。针对这种情况,采用8253定时器的频率发生器来控制信号的采样间隔;让微机向61H的Bitl送

N次值,将此数字语音信号0和1按某种比例混合,就相当于在扬声器上加了一个相对应的电压。此电压波型与原语音波型相似,可用此电压驱动扬声器发声,这就完成了数字语音信号与模拟信

号之间的转换,并且语音效果较为逼真。

2.程序设计

/* * * * * * * * * * * * * * * *//* 在DOS下用PC机的扬声器播放大镜*.WAV 文件程序*/ 

/* * * * * * * * * * * * * * * */ 

#include<dos .h> 

#include<dir .h> 

#include<stdio .h> 

#include<conio .h> 

#include<alloc .h> 

收稿日期:2000—06—02

68 辽宁高职学报第2卷

#include<string .h> 

#define MAXSIZE 50000 

#define BYTE unsigned char 

void mydelay( BYTE t) 

{ register BYTE j;for (j=0; j<t; j + +);} 

void main (int argc, char *argv [ ]) 

{ 

BYTE * VOL,I,done,fs[64]; 

FILE * rf; 

Struct ffblk ffb; 

Unsigned long int rlen; 

Register unsigned int count; 

Printf (“\n\r WAV speaker program \r\n\r”); 

Printf (“press any key to break! \r\n\r”); 

If ((vol=(unsigned char *)and malloc (MAXSIZE)==NULL) 

{printf (“Out of memouy! \n”;return;} 

ir (argc>1)strcpy (fs,argv [1];else strcpy (fs,“*.WAV”); 

done =findfirst (fs,&ffb,0); 

outportb (0x43,0xa4); 

outportb (0x42,0xff); 

while (!done) 

{ 

printf (“\r\n Saying %s”,ffb.ff name); 

rf=fopen (ffb.ff name, “rb”); 

fseek (rf,44,SEEK CUR); 

delay (100); 

do 

{ 

rlen=ftell (rf); 

fread (VOL,MAXSIZE,1,rf); 

rlen =ftell s(rf)-rlen; 

for (count=0;count<rlen:count + +) 

{ 

I=vol [count]; 

Outportb (0x61,inport (0x61)&0xfc);mydelay (i); 

Outportb (0x61,inport (0x61); 

Mydelay (0xff-1); 

} 

} 

while (rlen==MAXSIZE); 

fclose (rf); 

if (kbhit ()) {printf”\r\nUser break! \r\n”};return;} 

done=findnext (&ffb); 

} 

} 

3.结束语

采用本程序来控制扬声器的发声,不仅声音模拟能力强且声音频率不须预先设定,产生的语

音效果较为逼真。WAV语音文件的播放一般在Windows的应用程序中较易实现,在DOS环境下较为困难。本程序实现在DOS环境下直接用PC机的扬声器来播。 (下转71页)

第5期李广胜,李东生:提高VB应用程序执行效率的方法 71 4.结束语

以上提高VB应用程序执行效率都是在编程中的各个环节加以具体考虑的,通过不断的摸索,总结处在低档PC上运行VB应用程序时,综合考虑各项因素可以降低25%~30%的内存资源占用,从而提高VB应用程序的执行效率。最后顺便指出在计算机硬件配置上,适当增加机器的内存数量,使程序和数据尽量装入内存,减少频繁访问硬盘的时间,这样也能大大提高VB应用程序的执行效率。 

参考文献

[1] 龚沛曾,陆慰民,杨志强.Visual Basic程序设计教程.北京:高等教育出版社,1998

[2] 李罡,丁莉.Visual Basic 6.0中文版编程实例详解.北京:电子工业出版社,1999

The Method of improving efficiency in a

Visual Basic application program 

 

Li Guang-sheng, Li Dong-sheng 

(Computer Science Dep. Of FSHVTI. Fushun Liaoning: 113006) 

 

Abstract: At generic conditions, VB has characteristic of easiness and high efficiency as a software in windows. It’s executive efficiency is limited with the complication and enormousness of application program. The paper explicates the method of improving efficiency in VB application program on PC low level, w hich is based on form design, code compiling and sentence structure. 

Key words: Visual Basic; forms; code.

(责任编辑,抚顺职院:王雅萍)

 

(上接68页) 

所以,在DOS环境下设计能够直接用扬声器播放WAV语音文件的程序,对丰富在该环境下的开发应用有实际意义。 

参考文献

[1] 谭浩强.C程序设计.北京:清华大学出版社,1994

[2] 戴梅萼.微机计算机技术及应用.北京:清华大学出版社,1994

Program design of Broadcasting Wwav Phonetic

Documents Under the Circumstances of Dos

Li Dong-sheng,Wang Zhen

(Computer Science dept. of FSHVTI, Fushun Liaoning: 113006)

Abstract: This article gives the designing method of broadcasting program of windows, WAV phontic document under the circumstances of DOS. By using it,PC loudspeaker can broadcast W AV phonetic document directly under the circumstances of DOS.

Key words: WAV phonetic document; loudspeaker; 8253 timer; phonetic signal

(责任编辑,抚顺职院:王雅萍)

地球及其宇宙环境

第一讲 地球的宇宙环境 班级 姓名 学号 【测试要求】 ● 了解不同级别的天体系统,说明地球在太阳系中的位置。 ● 知道地球是太阳系中一颗既普通又特殊的行星,理解地球上存在生命的条件。 ● 了解太阳辐射对地球的影响。 ● 了解太阳活动对地球的影响。 【要点疏理】 1.天体是指宇宙间所有存在的物体(质),是宇宙间物质的存在方式。万有引力和天体的永恒运动(相互 、相互 )组成了多层次的天体系统。目前人类所知道的最高一级的天体系统是 ,最低一级的天体系统是 。天体系统层次可用下表来说明: 2.太阳系由 、围绕太阳运行的 及其 、 、太阳系 (小行星、彗星、流星体和行星际物质)等组成。 3.太阳系八大行星距离中心天体—— 由近及远排列依次是: 、 、 、 、 、 、 、 。 4.太阳系八大行星绕日公转的共同特征是 、 、 。 5.地球的特殊性表现在它是唯一有 的行星,其条件是:稳定的 ,安全的 (外部条件); , , (自身条件)。 6.地球表面有适于生命过程发生和发展的 条件,其原因是 距离适中、昼夜交替周期适中。 7.地球上有以 和 为主的、适合生物呼吸的大气,其原因是地球有适中的 和 能吸引气体聚集在地球周围、原始大气经过漫长的演化。 8.地球上有 ,其原因是地球内部物质运动形成水汽逸出,适宜的温度使水多以 的形式存在。 9.太阳源源不断地以 的形式向宇宙空间放射能量,这种现象称为 。 10.太阳辐射是维持地表 、促进地球上的 、 、 活动的主要动力,也是我们日常生活和生产所用的能源。温度 11.太阳外部大气由里向外,可分为 、 、 。太阳活动的主要类型是 和 ; 是太阳活动强弱的标志。 是太阳活动最激烈的显示。 12.当太阳黑子和耀斑增多时,其发射的 进入地球电离层,会引起 扰动,使地球上 受到影响,甚至出现短暂的中断;太阳大气抛出的高能带电粒子会扰乱 ,使之突然出现 现象,导致罗盘指针剧烈颤动,不能正确指示方向,无线电短波通信中断;太阳大气抛出的高能带电粒子高速冲击 地区的高空大气,会出现美丽的 。 总星系 其他恒星系统 其他行星系统

wav音频格式

多媒体技术近年来发展很快,较好品质的声卡可以提供16位的立体声及44KHZ的播放录制能力,它不仅可以提供原音逼真的取样,其合成的音质也十分理想,有的声卡还加入了数字信号处理器,可编程控制的DSP具有强大的运算能力,它可以用来作声音信息的压缩和一些特殊效果的处理。具有此功能的声卡提供的WAV文件提供的语音信息可以满足语音特征识别的要求。 RIFF概念 在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为"资源互换文件格式"(Resources lnterchange File Format),简称RIFF。例如声音的WAV 文件、视频的AV1文件等等均是由此结构衍生出来的。RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由"辨别码"、"数据大小"及"数据"所组成。 图一、块的结构示意图 辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。一般而言,chunk本身并不允许内部再包含chunk,但有两种例外,分别为以"RIFF"及"L1ST"为辨别码

的chunk。而针对此两种chunk,RIFF又从原先的"数据"中切出4个Byte。此4个Byte 称为"格式辨别码",然而RIFF又规定文件中仅能有一个以"RIFF"为辨别码的chunk。 图二、RIFF/LIST块结构 只要依循此一结构的文件,我们均称之为RIFF档。此种结构提供了一种系统化的分类。如果和MS一DOS文件系统作比较,"RIFF"chunk就好比是一台硬盘的根目录,其格式辨别码便是此硬盘的逻辑代码(C:或D:),而"L1ST"chunk即为其下的子目录,其他的chunk则为一般的文件。至于在RIFF文件的处理方面,微软提供了相关的函数。视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放怎样的目录,而在该目录下仅能放何种数据。 WAV文件格式 WAVE文件是非常简单的一种RIFF文件,它的格式类型为"WAVE"。RIFF块包含两个子块,这两个子块的ID分别是"fmt"和"data",其中"fmt"子块由结构PCMWAVEFORMAT所组成,其子块的大小就是sizeofof(PCMWAVEFORMAT),数据组成就是PCMWAVEFORMAT结构中的数据。

所有类型文件的文件头标志

各类文件的文件头标志 1、从Ultra-edit-32中提取出来的 JPEG (jpg),文件头:FFD8FF PNG (png),文件头:89504E47 GIF (gif),文件头:47494638 TIFF (tif),文件头:49492A00 Windows Bitmap (bmp),文件头:424D CAD (dwg),文件头:41433130 Adobe Photoshop (psd),文件头:38425053 Rich Text Format (rtf),文件头:7B5C727466 XML (xml),文件头:3C3F786D6C HTML (html),文件头:68746D6C3E Email [thorough only] (eml),文件头:44656C69766572792D646174653A Outlook Express (dbx),文件头:CFAD12FEC5FD746F Outlook (pst),文件头:2142444E MS Word/Excel (xls.or.doc),文件头:D0CF11E0 MS Access (mdb),文件头:5374616E64617264204A WordPerfect (wpd),文件头:FF575043 Postscript (eps.or.ps),文件头:252150532D41646F6265 Adobe Acrobat (pdf),文件头:255044462D312E Quicken (qdf),文件头:AC9EBD8F Windows Password (pwl),文件头:E3828596 ZIP Archive (zip),文件头:504B0304 RAR Archive (rar),文件头:52617221

wav文件头

一、各种W AV文件头格式 WAV文件也分好几个种类,相应的非数据信息存储在文件头部分,以下是各种WAV文件头格式。表18KHz采样、16比特量化的线性PCM语音信号的WAV文件头格式表(共44字节) 表28KHz采样、8比特A律量化的PCM语音信号的WAV文件头格式表(共58字节) 表38KHz采样、8比特U律量化的PCM语音信号的WAV文件头格式表(共58字节)

表4ADPCM语音编码后的WAV文件头格式表(共90字节) 表5GSM(Global System for Mobile Communication全球移动通信系统)语音编码后的WAV文件头格式表(共60字节)

表6SBC(Sub-Band Coding子带编码)语音编码后的WAV文件头格式表(共58字节) 表7CELP(Code Excited Linear Prediction码激励线性预测编码——近10年来最成功的语音编码算法)语音编码后的WAV文件头格式表(共58字节) 概念1、读取WAV文件,填写WAVEFORMATEX结构 WAVEFORMATEX

typedef struct{WORD wFormatTag;WORD nChannels;DWORD nSamplesPerSec;DWORD nAvgBytesPe rSec; WORD nBlockAlign;WORD wBitsPerSample;WORD cbSize;} WAVEFORMATEX; 具体参数解释如下: wFormatTag:波形数据的格式,定义在MMREG.H文件中 nChannels:波形数据的通道数:单声道或立体声 nSamplesPerSec:采样率,对于PCM格式的波形数据,采样率有8.0 kHz,11.025kHz,22.05 kHz,44.1 kHz 等 nAvgBytesPerSec:数据率,对于PCM格式的波形数据,数据率等于采样率乘以每样点字节数nBlockAlign:每个样点字节数 wBitsPerSample:采样精度,对于PCM格式的波形数据,采样精度为8或16 cbSize:附加格式信息的数据块大小 概念2、定义设备头结构 以下WAVEHDR定义了指向波形数据缓冲区的设备头。 WAVEHDR typedef struct { LPSTR lpData; DWORD dwBufferLength; DWORD dwBytesRecorded; DWORD dwUser ; DWORD dwFlags; DWORD dwLoops; struct wavehdr_tag * lpNext; DWORD reserved; } WAVEHDR; lpData:波形数据的缓冲区地址 dwBufferLength:波形数据的缓冲区地址的长度 dwBytesRecorded:当设备用于录音时,标志已经录入的数据长度 dwUser:用户数据 dwFlags:波形数据的缓冲区的属性 dwLoops:播放循环的次数,仅用于播放控制中 lpNext和reserved均为保留值 注意:上述结构体以及我们在程序中所使用到的“HWAVEIN””HWAVEOUT”结构体均是系统已经存在的,我们只需要对其进行赋值即可。 二、PCM(44字节)的W AV文件头及其相关的编程方法 1、以下就经常见的一种格式PCM(44字节)的WAV文件头进行分析。 举例说明:kugoo下载的一首wav文件:魏三抹去泪水wav.wav(大小14,703,980 字节,时长2:46),文件头如下: ⑴地址00H-03H,值为“RIFF”标志;

高中地理 地球的宇宙环境教案湘教版必修

1.1 地球的宇宙环境 [教学目标] 一、知识与技能 1.了解宇宙的物质形态和特点。 2.了解天体系统的级别和层次结构,了解地球在天体系统中的位置。 3.了解地球是宇宙中既普通又特殊的天体,正确理解地球上生命存在的条件。 二、过程与方法 1.通过阅读太阳系结构示意图,了解地球在太阳系中的位置,以及行星的运动特征,培养学生的读图和分析问题的能力。 2.通过对八大行星基本数据的对比、分析、归纳,培养学生观察思维的能力。 三、情感态度与价值观 通过了解宇宙的物质组成,使学生树立辩证唯物主义思想和正确的宇宙观,并注意识别和抵制伪科学。 [教学重点] 1.天体系统的结构层次; 2.地球上存在生命的条件及原因。 [教学难点] 地球存在生命的原因。 [教学媒体与教具] 地球仪、地球的卫星照片,星云和星系幻灯片,天文挂图,多媒体、“太阳系模式图”挂图,录像机及自行剪辑八大行星概况、彗星录像节目,投影片或月貌图片。 [课时安排] 2课时 [讲授过程] 第一课时 【新课导入】在我们生活着的地球之外,是一个广阔无边、无始无终的世界,被称为“宇宙”。宇宙里的许多奥秘在等着我们去探索。今天我们就来了解一些宇宙的知识。 【板书】第一章宇宙中的地球 第一节地球的宇宙环境 【介绍】同学们,你们知道中国古汉语中对“宇宙”两个字的定义么?“上下四方为宇、古往今来曰宙”。从这个角度来看,宇宙包含了地理学研究的两大视角“空间”和“时间”。人们对宇宙的认识经历了一个漫长的历史时期。 【板书】一、人们对宇宙的认识 【讲解】在人类发展的初期,由于人们的活动范围狭小,往往凭自己的直觉认识世界,看到眼前的地面是平的,就以为整个大地也是平的,并把天空看做是好像倒扣在平坦大地上的一口巨大的锅,于是,便有了“天圆地方”的说法。后来,人们经过观察,发现天空中的各个星体都在围绕着地球转,地球好像处于整个宇宙的中心位置,这样,便产生了“地心说”。由于受西方宗教势力的影响,这个学说观点统治人们的思想是相当长的。到16世纪,哥白尼的“日心说”使自然科学第一次从中世纪神学的桎梏下解放出来,认为“太阳是宇宙的中心”,意味着宇宙实际上就是太阳系。18世纪天文学家引进了“星系”一词。到了20世纪60年代,随着大型天文望远镜的使用,以及空间探测技术的发展,人们对宇宙的认识范围在不断地扩

语音识别字符分割算法_原创.

5.设计方法 5.1概述 5.2硬件系统的设计 语音信号预处理 (1)预加重 预加重的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。在计算机里用具有6dB/频程升高频特性的预加重数字滤波器来实现,一般是一阶的FIR数字滤波器: 为预加重系数,值接近于l,在0.9和1之间,典型值为0.94。 预加重的DSPBuilder实现: 为了便于实现,将上式中的一阶FIR预加重滤波器用差分方程表示为: 其中,为原始语音信号序列,N为语音长度,上面的公式显示其在时域 上的特性。又因为0.94接近于15/16,所以将上面的式子变为 除以16可以用右移4位来实现,这样就将除法运算化简为移位运算,降低了计算复杂度。在后面的模块设计中,也乘以或者除以一些这样的数,这些数为2的幂次,都可以用移位来实现。 预加重的硬件实现框图如下: 预加重实现框图 DSP Builder中的图形建模为:

预加重滤波器的DSPBuilder结构图 (2)分帧 语音信号是一种典型的非平稳信号,其特性随时间变化,其在很短的时间内是平稳的,大概为1小20ms,其频谱特性和物理特征可近似的看做不变,这样就可以采用平稳过程的分析处理方法来处理。 分帧的DSP Builder实现: 语音信号在10到20ms之间短时平稳(这样可以保证每帧内包含1一7个基音周期),也就是说选取的帧长必须介于10到20ms之间,此外,在MFCC特征提取时要进行FFT变换,FFT点数一般为2的幂次,所以本文中选择一帧长度为16ms,帧移为1/2帧长,这样一帧就包含了16KHz*16ms=256个点,既满足短时平稳,又满足FFT变换的要求。 由于采集的语音是静态的,语音长度已知,很容易计算出语音的帧数,但是在硬件上或实时系统中,语音长度是无法估计的,而且还要考虑存储空间的大小和处理速度,采用软件实现时的静态分帧方法是行不通的,可以利用硬件本身的特点进行实时的动态分帧。 为了使帧与帧之间平滑过渡,保持连续语音流的自相关性和过渡性,采用交叠分帧的算法。帧移取1/2帧长,即128个数据点当作一个数据块。FIFO1大小为一帧语音长度,分成两个数据块,预加重后的数据写入这个FIFO。为了实现帧移交叠,在FIFO1读数据时,同时再用FIFO2保存起来,当FIFO的一块数据读完以后,紧接着从FIF22读出这一块的副本。写入的一块数据,相当于被重复读出2次,所以FIFO1的读时钟频率设计为写时钟频率的2倍,而FIFOZ的读写时钟频率和FIFO1的读时钟频率相同。分帧以后的数据在图中按时间标号为1、2、2、3.··…,1、2为第一帧,2、3为第二帧,以此类推。

WAV文件格式说明

WAV文件格式说明 ――杨少军WAVE文件是以RIFF(Resource Interchange File Format,"资源交互文件格式")格式来组织内部结构的。RIFF文件结构可以看作是树状结构,其基本构成是称为"块"(Chunk)的单元,最顶端是一个“RIFF”块,下面的每个块有“类型块标识(可选)”、“标志符”、“数据大小”及“数据”等项所组成,其中,format chunk和data chunk是必需要的,其它的chunk可选。在data chunk中存放的数据可能是压缩的也可能是非压缩的,这是根据format chunk中的wFormatTag来决定的,如果wFormatTag为WA VE_FORMA T_PCM 时,表示数据为非压缩的,其它的为压缩的。在非压缩格式时,存放的数据就是PCM码;而在采用压缩格式时,由于各个公司都有自己的压缩算法,没有一个统一的标准,所以压缩制式非常杂。下面主要以INTEL 公司的IMA-ADPCM压缩算法来讲W A V文件的结构。 1.WA V文件内部结构 在讲W A V文件结构时,主要以非压缩格式和以INTEL 公司的IMA-ADPCM压缩算法来论述。下面来谈谈INTEL 公司的IMA-ADPCM压缩算法。 IMA-ADPCM 是Intel公司首先开发的是一种主要针对16bit采样波形数据的有损压缩算法, 压缩比为4:1.它与通常的DVI-ADPCM是同一算法。它是将声音流中每次采样的16bit 数据以4bit 存储。具体的压缩算法可以参看其它文章。

在wFormatTag为W A VE_FORMA T_PCM时,没有Fact Chunk,也没有format chunk 中的wSamplesPerBlock,data chunk中紧跟着DataChunkSize后的就是PCM数据了。而在wFormatTag为WA VE_FORMA T_DVI_ADPCM时,表示采用INTEL 公司的IMA-ADPCM 压缩算法,W A V文件格式即为上表所示。 在采用IMA-ADPCM压缩算法时,“data”chuck中的数据是以block形式来组织的,把它叫做“段”,也就是说在进行压缩时,并不是依次把所有的数据进行压缩保存,而是分段进行的。Data Block一般是由block header (block头) 和data 两者组成的。其中block header是一个结构,它在单声道下的定义如下: Typedef struct { short sample0; //block中第一个采样值(未压缩) BYTE index; //上一个block最后一个index,第一个block的index=0; BYTE reserved; //尚未使用 }MonoBlockHeader; 有了blockheader的信息后,就可以不需要知道这个block前面和后面的数据而轻松地解出本block中的压缩数据。对于双声道,它的blockheader应该包含两个MonoBlockHeader 其定义如下: typedaf struct { MonoBlockHeader leftbher; MonoBlockHeader rightbher; }StereoBlockHeader; 在解压缩时,左右声道是分开处理的,所以必须有两个MonoBlockHeader;

常见文件类型文件头

JPEG (jpg),文件头:FFD8FF PNG (png),文件头:89504E47 GIF (gif),文件头:47494638 TIFF (tif),文件头:49492A00 Windows Bitmap (bmp),文件头:424D CAD (dwg),文件头:41433130 Adobe Photoshop (psd),文件头:38425053 Rich Text Format (rtf),文件头:7B5C727466 XML (xml),文件头:3C3F786D6C HTML (html),文件头:68746D6C3E Email [thorough only] (eml),文件头: 44656C69766572792D646174653A Outlook Express (dbx),文件头:CFAD12FEC5FD746F Outlook (pst),文件头:2142444E MS Word/Excel (xls.or.doc),文件头:D0CF11E0 MS Access (mdb),文件头:5374616E64617264204A WordPerfect (wpd),文件头:FF575043 Postscript (eps.or.ps),文件头:252150532D41646F6265 Adobe Acrobat (pdf),文件头:255044462D312E Quicken (qdf),文件头:AC9EBD8F Windows Password (pwl),文件头:E3828596 ZIP Archive (zip),文件头:504B0304

1-1地球的宇宙环境教案湘教版必修一

第一单元从宇宙看地球 第一节地球的宇宙环境 【教学目标】 一.知识与技能目标 1.知道宇宙中的天体、天体系统的概念,绘图说明天体系统的级别大小,确定地球在天体系统中所处的位置。 2.认识太阳系的成员,确定地球在太阳系中所处的位置。运用资料说出九大行星的运动特征和结构特征。 3.利用资料证明地球是太阳系中一颗既普通又特殊的行星,理解地球上存在生命物质的原因。 二.过程与方法目标 1.阅读知识窗“多样的天体”等图文信息,认识各类天体的主要特征;通过观察实践、利用网络等媒体,收集天文科普材料,增强对宇宙环境的感性认识。2.通过阅读“天体系统示意图”,设计相应的简明框图,描述地球所处的宇宙环境。 3.阅读“太阳系模式图”,归纳九大行星绕日公转的共同特点;利用资料证明太阳活动对地球产生的影响。 4.运用相关学科知识,从温度、水、大气等方面,分析地球上存在生命物质的条件,逆推地球上能形成生命的原因。并以小组讨论的形式,提出在宇宙中寻找外星人的依据。 三.情感态度与价值观目标 1.通过了解地球所处的宇宙环境,树立宇宙是物质的科学宇宙观。破除迷信,反对邪教。 2.通过寻找外星人的探讨活动,一方面激发学生探究地理问题的兴趣,体验自主、合作、创新探究过程和团队意识。另一方面,培育珍惜、爱护人类共同的家园――“只有一个地球”的意识,增强关注人类未来生存空间的责任感。3.通过认识地球是太阳系中一颗既普通又特殊的行星,确立任何事物发展都有其普遍性和特殊性的观点; 4.通过观赏天体照片等相关视频信息,激发地理审美情趣。

【教学重点】天体、天体系统的概念;太阳对地球的影响;地球上存在生命的原因。 【教学难点】太阳活动对地球的影响;地球上生命存在的原因。 【教学方法】指导学生自主学习、协作探究、交流互评。充分利用教科书搭建的平台,引导学生自己动脑、动手、在自主探究的过程中,构建新知。 【教学过程】 一.引入新课 设置问题,引入课堂情景: 凭着你的认识,你怎样向别人描述宇宙或地球? (学生交流,尽情畅谈,插入读图1-1-1“人类信息图”,教师根据学生的回答,将答案分类汇总引入到:第一单元从宇宙看地球的内容安排、知识结构:宇宙——太阳——地球) [图1-1-1解析]1972~73年美国“先驱者”10号、11号探测器携带的镀金铝板镌刻的图案,图中表达的含义: ◆太阳系及其九大行星 ◆地球在九大行星中的位置 ◆航天器发射路径 ◆根据地球上人类特征绘制的一对男女裸体人像 ◆人像背后是按比例绘制的航天器外形,表明人体大小 ◆地球相对于14颗脉冲星的位置关系 ◆氢分子结构图 [讨论]如果请你画一幅图画与“外星人”对话,你最想告诉他们有关人类与地球的哪些信息? [拓展资料]美国“旅行者”1号、2号探测器携带的镀金铜板刻录的唱片“地球之声”,长120分钟 ◆ 115幅照片、图表(含中国长城、家宴) ◆ 60种语言的问候语(含中国普通话、粤、厦门和江浙方言) ◆地球上自然界的各种声音

很好的资料-wav文件头汇总

一、各种WA V文件头格式

概念1、读取WAV文件,填写WAVEFORMATEX结构WAVEFORMATEX

typedef struct{WORD wFormatTag;WORD nChannels;DWORD nSamplesPerSec;DWORD nAvgBytesPe rSec;WORD nBlockAlign;WORD wBitsPerSample;WORD cbSize;}WAVEFORMATEX; 具体参数解释如下: wFormatTag:波形数据的格式,定义在MMREG.H文件中 nChannels:波形数据的通道数:单声道或立体声 nSamplesPerSec:采样率,对于PCM格式的波形数据,采样率有8.0kHz,11.025kHz,22.05kHz,44.1kHz 等 nAvgBytesPerSec:数据率,对于PCM格式的波形数据,数据率等于采样率乘以每样点字节数nBlockAlign:每个样点字节数 wBitsPerSample:采样精度,对于PCM格式的波形数据,采样精度为8或16 cbSize:附加格式信息的数据块大小 概念2、定义设备头结构 以下WAVEHDR定义了指向波形数据缓冲区的设备头。 WAVEHDR typedef struct{LPSTR lpData;DWORD dwBufferLength;DWORD dwBytesRecorded;DWORD dwUser; DWORD dwFlags;DWORD dwLoops;struct wavehdr_tag*lpNext;DWORD reserved;}WAVEHDR; lpData:波形数据的缓冲区地址 dwBufferLength:波形数据的缓冲区地址的长度 dwBytesRecorded:当设备用于录音时,标志已经录入的数据长度 dwUser:用户数据 dwFlags:波形数据的缓冲区的属性 dwLoops:播放循环的次数,仅用于播放控制中 lpNext和reserved均为保留值 注意:上述结构体以及我们在程序中所使用到的“HWAVEIN””HWAVEOUT”结构体均是系统已经存在的,我们只需要对其进行赋值即可。 二、PCM(44字节)的W A V文件头及其相关的编程方法 1、以下就经常见的一种格式PCM(44字节)的WAV文件头进行分析。 举例说明:kugoo下载的一首wav文件:魏三抹去泪水wav.wav(大小14,703,980字节,时长2:46),文件头如下: ⑴地址00H-03H,值为“RIFF”标志;

详解wave头格式(尽可能详细并附代码)

整理网上和读书时的资料,结合自己的实际经验,给出wav头格式的解释和源代码,既是对自己的总结,同时又服务大家。另外在给出几个实际例子,如果看了这篇文档还不能正确写出wave文件,那就要吊起来打了^_^。 ——flywen 2010-10-13 参考网址一:https://www.sodocs.net/doc/d27018659.html,/sshcx/archive/2007/05/01/1593923.aspx 参考网址二:https://www.sodocs.net/doc/d27018659.html,/share/detail/15909594 WAVE 文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是"RIFF"。WAVE 文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件 标识段和声音数据格式说明段两部分。 常见的声音文件主要有两种,分别对应于单声道(11.025KHz 采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在"模→数"转换过程中单位时间内采样的次数。 采样值是指每一次采样周期内声音模拟信号的积分值。 [!21ki@][@21ki!] 对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。 WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE文件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。在多声道WAVE文件中,样本是交替出现的。 参考网址一和二中都给出了wav的头定义,但有一个小区别,一中将这个44个字节作为一个大的头,给定在一个结构体中,而二中则是按照四个不同的chunk处理的,所以就给了四个结构体,后面我的代码也是根据二来写的,个人觉得这样比较清晰,不过这纯属个人感觉。 下面就是根据四个结构体写的代码,注意FACT不是必须的,可以不用写入头,不写的话就是44个字节,写的话wave的头是56个字节。 一:源代码(参考二中也有比较详细的读wave头的代码) #if !defined(_WAV_INFO_) #define _WAV_INFO_ // 一些和声音数据相关的宏 #define SAMPLE_RATE 22050 // sample rate,每秒22050个采样点 #define QUANTIZATION 0x10 // 16bit量化, #define BYTES_EACH_SAMPLE 0x2 // QUANTIZATION / 8, 所以每个采样点、 // 是short,占个2个字节 #define CHANNEL_NUN 0x1 // 单声道 #define FORMAT_TAG 0x1 // 线性PCM // 一个wave file包括四个CHUNK,除了FACT之外,其它是必须的,并且第一个RIFF是整个文件的头,// 所以别名为WAV_HEADER,而不是RIFF /*------------------------Wave File Structure ------------------------------------ */ typedef struct RIFF_CHUNK{

语音识别综述

山西大学研究生学位课程论文(2014 ---- 2015 学年第 2 学期) 学院(中心、所):计算机与信息技术学院 专业名称:计算机应用技术 课程名称:自然语言处理技术 论文题目:语音识别综述 授课教师(职称): 研究生姓名: 年级: 学号: 成绩: 评阅日期: 山西大学研究生学院 2015年 6 月2日

语音识别综述 摘要随着大数据、云时代的到来,我们正朝着智能化和自动化的信息社会迈进,作为人机交互的关键技术,语音识别在五十多年来不仅在学术领域有了很大的发展,在实际生活中也得到了越来越多的应用。本文主要介绍了语音识别技术的发展历程,国内外研究现状,具体阐述语音识别的概念,基本原理、方法,以及目前使用的关键技术HMM、神经网络等,具体实际应用,以及当前面临的困境与未来的研究趋势。 关键词语音识别;隐马尔科夫模型;神经网络;中文信息处理 1.引言 语言是人类相互交流最常用、有效的和方便的通信方式,自从计算机诞生以来,让计算机能听懂人类的语言一直是我们的梦想,随着大数据、云时代的到来,信息社会正朝着智能化和自动化推进,我们越来越迫切希望能够摆脱键盘等硬件的束缚,取而代之的是更加易用的、自然的、人性化的语音输入。语音识别是以语音为研究对象,通过对语音信号处理和模式识别让机器自动识别和理解人类口述的语言。 2.语音识别技术的发展历史及现状 2.1语音识别发展历史 语音识别的研究工作起源与上世纪50年代,当时AT&T Bell实验室实现了第一个可识别十个英文数字的语音识别系统——Audry系统。1959年,J.W.Rorgie和C.D.Forgie采用数字计算机识别英文元音及孤立字,开始了计算机语音识别的研究工作。 60年代,计算机应用推动了语音识别的发展。这时期的重要成果是提出了动态规划(DP)和线性预测分析技术(LP),其中后者较好的解决了语音信号产生模型的问题,对后来语音识别的发展产生了深远的影响。 70年代,LP技术得到了进一步的发展,动态时间归正技术(DTW)基本成熟,特别是矢量量化(VQ)和隐马尔科夫(HMM)理论的提出,并且实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。 80年代,实验室语音识别研究产生了巨大的突破,一方面各种连接词语音识别算法被开发,比如多级动态规划语音识别算法;另一方面语音识别算法从模板匹配技术转向基于统计模型技术,研究从微观转向宏观,从统计的角度来建立最佳的语音识别系统。隐马尔科夫模型(HMM)就是其典型代表,能够很好的描述语音信号的时变性和平稳性,使大词汇量连

wave文件(.wav)格式、PCM数据格式

wave文件(*.wav)格式、PCM数据格式 1. 音频简介 经常见到这样的描述: 44100HZ 16bit stereo 或者22050HZ 8bit mono 等等. 44100HZ 16bit stereo: 每秒钟有44100 次采样, 采样数据用16 位(2字节)记录, 双声道(立体声); 22050HZ 8bit mono: 每秒钟有22050 次采样, 采样数据用8 位(1字节)记录, 单声道; 当然也可以有16bit 的单声道或8bit 的立体声, 等等。 采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。采样值是指每一次采样周期内声音模拟信号的积分值。 对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH); 而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位(左声道)和低八位(右声道)分别代表两个声道。 人对频率的识别范围是20HZ - 20000HZ, 如果每秒钟能对声音做20000 个采样, 回放时就足可以满足人耳的需求. 所以22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。这和电影的每秒24 帧图片的道理差不多。 每个采样数据记录的是振幅, 采样精度取决于储存空间的大小: 1 字节(也就是8bit) 只能记录256 个数, 也就是只能将振幅划分成256 个等级; 2 字节(也就是16bit) 可以细到65536 个数, 这已是CD 标准了; 4 字节(也就是32bit) 能把振幅细分到4294967296 个等级, 实在是没必要了. 如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍. 这样我们就可以根据一个wav 文件的大小、采样频率和采样大小估算出一个wav 文件的播放长度。 譬如"Windows XP 启动.wav" 的文件长度是424,644 字节, 它是"22050HZ / 16bit / 立体声" 格式(这可以从其"属性->摘要" 里看到), 那么它的每秒的传输速率(位速, 也叫比特率、取样率)是22050*16*2 = 705600(bit/s), 换算成字节单位就是705600/8 = 88200(字节/秒), 播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。 但是这还不够精确, 包装标准的PCM 格式的WAVE 文件(*.wav)中至少带有42 个字节的头信息, 在计算播放时间时应该将其去掉, 所以就有:(424644-42) / (22050*16*2/8) ≈ 4.8140816(秒). 这样就比较精确了. 关于声音文件还有一个概念: "位速", 也有叫做比特率、取样率, 譬如上面文件的位速是705.6kbps 或705600bps, 其中的b 是bit, ps 是每秒的意思;

几种常见音频视频音乐文件格式

几种常见音频视频音乐文件格式 1、.wmv WMV是微软推出的一种流媒体格式,它是在“同门”的ASF(Advanced Stream Format)格式升级延伸来得。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。AVI文件将视频和音频封装在一个文件里,并且允许音频同步于视频播放。与DV D视频格式类似,AVI文件支持多视频流和音频流。WMV 不是仅仅基于微软公司的自有技术开发的。从第七版(WMV1)开始,微软公司开始使用它自己非标准MPEG-4 Par t 2。但是,由于WMV第九版已经是SMPTE的一个独立标准(421M,也称为VC-1),有理由相信WMV的发展已经不象MPEG-4那样是一个它自己专有的编解码技术。现在VC-1专利共享的企业有16家(2006年4月),微软公司也是MPEG-4 AVC/H.264专利共享企业中的一家。微软的WMV还是很有影响力的。可是由于微软本身的局限性其WMV 的应用发展并不顺利。第一, WM9是微软的产品它必定要依赖着Windows,Windows 意味着解码部分也要有PC,起码要有PC机的主板。这就大大增加了机顶盒的造价,从而影响了视频广播点播的普及。第二,WMV技术的视频传输延迟非常大,通常要10几秒钟,正是由于这种局限性,目前WMV也仅限于在计算机上浏览WM9视频文件。WMV-HD是由软件业的巨头微软公司所创立的一种视频压缩格式,一般采用.wmv为文件后缀名。其压缩率甚至高于MPEG-2标准,同样是2小时的HDTV节目,如果使用MPEG-2最多只能压缩至30GB,而使用WMV-HD这样的高压缩率编码器,在画质丝毫不降的前提下都可压缩到15GB以下。WMV-HD,基于WMV9标准,是微软开发的视频压缩技术系列中的最新版本,尽管WMV-HD是微软的独有标准,但因其在操作系统中大力支持WMV系列版本,从而在桌面系统得以迅速普及。在性能上,WMV-HD的数据压缩率与H.264一样,两者的应用领域也极其相似,因此在新一代主流视频编码标准霸主地位的争夺之中,双方展开了针锋相对的斗争,而斗争的焦点集中在下一代光盘规格“HD DVD”和数字微波广播电视等领域。一般采用.wmv为后缀的HDTV文件就是采用的WMV-HD压缩的。目前DVD论坛已经初步批准将MPEG-2、H.264和微软的WMA-HD作为下一代DVD即HD-DVD技术的强制执行 标准。 2、.MOV MOV即QuickTime影片格式,它是Apple公司开发的音频、视频文件格式,用于存储常用数字媒体类型,如音频和视频。当选择QuickTime (*.mov)作为“保存类型”时,动画 将保存为.mov 文件. 用格式工厂1.90可以转换 3、.mpeg MPEG1 MPEG1格式即我们通常所说的VCD视频格式。它可针对SIF标准分辨率的图像进行压缩,视频速度每秒可播放30帧,具有画质好、音质接近于CD等优点,不过对解码芯片的运算能力有较高要求。

基于DTW算法的语音识别原理与实现

广州大学机械与电气工程学院 数字语音信号处理 基于DTW算法的语音识别原理与实现 院系: 机电学院电子与通信工程 姓名: 张翔 学号: 2111307030 指导老师: 王杰 完成日期: 2014-06-11

基于DTW算法的语音识别原理与实现 [摘要]以一个能识别数字0~9的语音识别系统的实现过程为例,阐述了基于DTW算法的特定人孤立词语音识别的基本原理和关键技术。其中包括对语音端点检测方法、特征参数计算方法和DTW算法实现的详细讨论,最后给出了在Matlab下的编程方法和实验结果,结果显示该算法可以很好的显示特定人所报出的电话号码。 [关键字]语音识别;端点检测;MFCC系数;DTW算法 Principle and Realization of Speech Recognition Based on DTW Algorithm Abstract With an example of the realization of a 0~9 identifiable speech recognition system, the paper described the basic principles and key technologies of isolated word speech recognition based on DTW algorithm, including method of endpoint detection, calculation of characteristic parameters, and implementation of DTW algorithm. Programming method under Matlab and experimental results are given at the end of the paper.,and the results show that the algorithm can well display the phone number of the person reported. Keyword speech recognition; endpoint detection; MFCC parameter; DTW algorithm 一、引言 自计算机诞生以来,通过语音与计算机交互一直是人类的梦想,随着计算机软硬件和信息技术的飞速发展,人们对语音识别功能的需求也更加明显和迫切。语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。传统的键盘、鼠标等输入设备的存在大大妨碍了系统的小型化,而成熟的语音识别技术可以辅助甚至取代这些设备。在PDA、智能手机、智能家电、工业现场、智能机器人等方面语音识别技术都有着广阔的前景。 语音识别技术起源于20世纪50年代,以贝尔实验室的Audry系统为标志。先后取得了线性预测分析(LP)、动态时间归整(DTW)、矢量量化(VQ)、隐马尔可夫模型(HMM)等一系列关键技术的突破和以IBM的ViaVoice、Microsoft的V oiceExpress为代表的一批显著成果。国内的语音识别起步较晚,1987年开始执行国家863计划后语音识别技术才得到广泛关注。具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室,中科院声学所等。其中中科院自动化所研制的非特定人连续语音听写系统和汉语语音人机对话系统,其准确率和系统响应率均可达90%以上。 常见的语音识别方法有动态时间归整技术(DTW)、矢量量化技术(VQ)、隐马尔可夫模型(HMM)、基于段长分布的非齐次隐马尔可夫模型(DDBHMM)和人工神经元网络(ANN)。

地理知识点梳理-宇宙与地球

2018合格考知识点梳理--地球 教学目标: 1.了解地球所处的宇宙环境;掌握天体的概念和类型,理解天体系统的形成和等级差别。 2.能够运用资料说明地球的普通性与特殊性,学会分析地球上存在生命的原因。 3.了解划分地球内部圈层的结构, 4.了解太阳活动的主要类型、分布及其对地理环境和人们生产、生活的影响。 5.识记地球自转的方向、周期、速度等基本规律。 6.掌握晨昏线的判读及应用。 7.学会地方时、区时、日界线的计算。 8.运用地转偏向力解释一些自然现象。 9.理解正午太阳高度和昼夜长短的季节变化、纬度变化及其成因。 知识详解: 一、地球的宇宙环境 1.多层次的天体系统 (1)天体系统:万有引力和天体的永恒运动维系着天体之间的关系,组成了多层次的天体系统。 (2)天体系统的层次 总星系??? ?? 银河系?? ??? 太阳系??? 地月系? ???? 地球 月球其他行星系其他恒星系河外星系 2.普通而特殊的行星——地球 (1)普通性:在太阳系中,就外观和所处的位置而言,地球是一颗普通的行星。

八颗行星????? 类地行星:A 水星、B 金星、C 地球、D 火星巨行星:E 木星、F 土星远日行星:G 天王星、H 海王星 (2)特殊性——目前所知道的唯一存在生命的行星。 ①充足的水分。 ②恰到好处的大气厚度和大气成分。 ③适宜的太阳光照和温度范围。 二、太阳活动与地球 (1)太阳大气层的结构:A 光球层,B 色球层,C 日冕层。 (2)太阳活动的主要类型:A 层的黑子,B 层的耀斑,其周期约为11年,它们都是太阳活动的重要标志。 (3)对地球的影响 ①影响地球气候:地球气候变化与太阳活动有明显的相关性。 ②干扰电离层,影响短波通信。 ③扰乱地球磁场,产生“磁暴”现象。 ④在地球高纬地区出现极光。 【要点讲解】太阳活动及其对地球的影响

相关主题