用MATLAB实现语音信号的时域分析 联系客服

发布时间 : 星期二 文章用MATLAB实现语音信号的时域分析更新完毕开始阅读

语音信号时域波形0.20.1幅度0-0.1-0.2-0.300.511.52样点数2.533.5x 1044

图2 语音“ke”的时域波形

(3)本实验将L盘的a.wav文件读取出来,当帧长取不同值时计算语音信号的短时能量,如图3所示。从图3可以看出,浊音短时能量大,短时平均幅度大,短时过零率低,浊音具有较强的能量值,音段内隐藏信息的能力高。清音短时能量小,短时平均幅度小,能量值较低,音段内隐藏信息的能力较低;

4

语音信号时域波形15语音信号的短时能量 帧长LEN = 200.5105幅度0-0.5012样点数3440 0100200300400x 10语音信号的短时能量10帧长LEN = 100语音信号的短时能量 10帧长LEN = 200 550 0501001502000 050100

图3 不同帧长对应的短时能量

(4)本实验首先读取a.wav中的语音数据,之后计算每一帧的短时过零率,最后将原始语音信号和短时过零率显示出来,如图4所示。从图4可以看出,清音的过零率较高,浊音的过零率较低。

5

语音信号时域波形0.2幅度0-0.200.511.52样点数2.533.5x 1044语音信号的短时过零率80短时过零率6040200050100150帧数200250300350

图4 短时过零率

(5)本实验首先读取a.wav中的语音数据,之后对数据进行分帧加窗处理,帧长为256,帧移为128。选取其中的一帧浊音(第*帧)并计算这帧的短时自相关函数。当窗函数分别为矩形窗和汉明窗时,截取的语音信号和短时自相关函数如图5和图6所示。从图5和图6可以看出,矩形窗能够比汉明窗更明显的显示出第一个峰值。当窗函数为矩形窗,不同帧长(帧移=帧长)的一帧浊音对应的短时自相关函数如图7和图8所示。从图7和图8可以看出,帧长越长,越容易区分其最大值。当窗函数为矩形窗,帧长为256,帧移为128,选取一帧清音,获得的短时自相关函数如图9所示。从图5和图9可以看出,浊音具有明显的周期性,清音无明显周期。

6

加矩形窗的语音帧0.5幅度0-0.5024101214样点数加矩形窗的短时自相关函数6816182010.5R(k)0-0.5-10246810k1214161820

图5 加矩形窗的短时自相关函数

加汉明窗的语音帧0.5幅度0-0.5050100150200250样点数加矩形窗的短时自相关函数10.5R(k)0-0.5-1050100k150200250

7