语音信号的采集与分析文献综述

发布时间 : 星期一 文章语音信号的采集与分析文献综述更新完毕开始阅读

注:该文档为原创,仅提供参考

语音信号的采集与分析的研究现状与进展

学生姓名:陈静波 指导教师:张石清

班级:11级电子信息2班 学号:1130220060

摘要: 语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,主要运用Matlab以及DSP等一些电脑软件进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化

关键词:语音信号,采集与分析, Matlab

1. 课题背景

The speech processing studies have advanced rapidly in recent years spurred on by great progresses in the VLSI technologies and in the digitalization of the networks. This paper offers an overview of the most attractive techniques which have focused the recent researchs

and developments in speech coding, recognition and synthesis areas. For speech compression, the emphasis is put on a family of techniques named code-excited linear prediction (CELP) which dominates current studies for rates in the range of 4 to 16 kbit/s. In terms of speech recognition, particular emphasis is placed on the ollowing three elements which are essential in order to increase the robustness of the systems : telephone line adaptation, rejection of parasite noise and out-of- vocabulary words, and

keyword spotting. In terms of text-to-speech synthesis, the PSOLA (pitch synchronous overlap and add) technique is outlined herein. This echnique gives rise to a new generation of synthesis systems which produce speech with very natural timbre. The analysis of current tendencies for each area allows to suggest attractive directions for future research.

语音信号采集与分析是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科,与心理学、生理学、通信与信息科学、计算机科学以及模式识别和人工智能等学科 都有着非常密切的关系。对语音信号进行采集与分析的研究一 直是数字信号处理技术发展的重要推动力量,这是因为许多新 的处理方法的提出,首先是在语音信号处理中获得成功,然后再 推广到其他领域。语音信号的分析与处理作为一个重要的研究 领域,随着通信技术的发展,语音采集和分析仪器的数字化、智 能化、小型化和多功能化的发展越来越快,其分析速度也有了大 幅度的提高。但现在市场上的语音分析系统价格昂贵、操作复 杂,且仅能用于特定的测量分析项目。基于上述不足,设计一款基Maflab的语音信号采集与分析系统[1],其具有价格便宜、使用方便、通用性强等优点。

2. 研究现状

语音信号的采集与分析作为一个重要的研究领域,已经有很长的研究历史。但是它的快速发展可以说是从1940年前后Dudley的声码器(vocoder)和potter等人的可见语音Visible Speech)开始的[1]。1952年贝尔(Bell)实验室的Davis等人首次研制成功能识别十个英语数字的实验装置。1956年Olson和Belar等人采用8个带通滤波器组提取频谱参数作为语音的特征,研制成功一台简单的语音打字机。20世纪60年代初由于Faut和Steven的努力,奠定了语音生成理论的基础,在此基础上语音合

成的研究得到了扎实的进展。20世纪60年代中期形成的一系列数字信号处理方法和技术,如数字滤波器、快速傅里叶变换(FFT)等成为语音信号数字处理的理论和技术基础。在方法上,随着电子计算机的发展,以往的以硬件为中心的研究逐渐转化为以软件为主的处理研究。然而,在语音识别领域内,初期有几种语音打字机的研究也很活跃,但后来已全部停了下来,这说明了当时人们对话音识别难度的认识得到了加深,所以1969年美国贝尔研究所的Pierce感叹地说?语音识别向何处去??。

到了1970年,好似反驳Pierce的批评,单词识别装置开始了实用化阶段,其后实用化的进程进一步高涨,实用机的生产销售也上了轨道[2]。此外社会上所宣传的声纹(Voice Print)识别,即说话人识别的研究也扎扎实实地开展起来,并很快达到了实用化的阶段.到了1971年,以美国ARPA(American Research Projects Agency)为主导的?语音理解系统?的研究计划也开始起步。这个研究计划不仅在美国国内,而且对世界各国都产生了很大的影响,它促进了连续语音识别研究的兴起。历时五年的庞大的ARPA研究计划,虽然在语音理解、语言统计模型等方面的研究积累了一些经验,取得了许多成果,但没能达到巨大投资应得的成果,在1976年停了下来,进入了深刻的反省阶段。但是,在整个20世纪70年代还是有几项研究成果对语音信号处理技术的进步和发展产生了重大的影响。这就是20世纪70年代初由板仓(Itakura)提出的动态时间规整(DTW)技术,使语音识别研究在匹配算法方面开辟了新思路;20世纪70年代中期线性预测技术(LPC)被用于语音信号处理,此后隐马尔可夫模型法(HNMM)也获得初步成功,该技术后来在语音信号处理的多个方面获得巨大成功;20世纪70年代未,Linda、Buzo、Gray和Markel等人首次解决了矢量量化(VQ)码书生成的方法,并首先将矢量量化技术用于语音编码获得

成功。从此矢量量化技术不仅在语音识别、语音编码和说话人识别等方面发挥了重要作用,而且很快推广到其他许多领域。因此,20世纪80年代开始出现的语音信号处理技术产品化的热溯,与上述语音信号处理新技术的推动作用是分不开的。20世纪80年代,由于矢量量化、隐马尔可夫模型和人工神经网络(ANN)等相继被应用于语音信号处理,并经过不断改进与完善,使得语音信号处理技术产生了突破性的进展。其中,隐马尔可夫模型作为语音信号的一种统计模型,在语音信号处理的各个领域中获得了广泛的应用。其理论基础是1970年前后,由Baum等人建立起来的,随后,由美国卡内基梅隆大学 (CMU)的Baker和美国IBM公司的Jelinek等人将其应用到语音识别中。由于美国贝尔实验室的Babiner等人在20世纪80年代中期,对隐马尔可夫模型深人浅出的介绍,才使世界各国从事语音信号处理的研究人员了解和熟悉,进而成为一个公认的研究热点,也是目前语音识别等的主流研究途径[2]。

进入20世纪90年代以来,语音信号采集与分析在实用化方面取得了许多实质性的研究进展。其中,语音识别逐渐由实验室走向实用化。一方面,对声学语音学统计模型的研究逐渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工种经网络的结合成为研究的热点。另一方面,为了语音识别实用化的需要,讲者自适应、听觉模型、快速搜索识别算法以及进一步的语言模型的研究等课题倍受关注。

目前语音信号的采集和处理主要基于仿真软件如:MATLAB仿真,以及基于DSP数字化模块处理、小波变换对语音信号的时域和频域的分析处理 2.1 基于MATLAB语音信号的采集过程以及分析过程

MATLAB中提供了强大的数据采集工具箱[3]可满足控制声卡对数据进行采集的

联系合同范文客服:xxxxx#qq.com(#替换为@)