源碼:
https://download.csdn.net/download/weixin_38719187/12678952
一、課題介紹
本設計為基于MATLAB的HMM語音信号識别,可以識别0-9十個阿拉伯數字,帶有一個豐富的人機互動GUI界面。算法流程為:顯示原始波形圖……顯示語音結束處放大波形圖……顯示短時能量……設定門限……開始端點檢測……,也可以通過添加噪聲,對比加噪後的識别準确率。後續可二次開發,做成九宮格形式,做一個電話撥号音識别。
二、運作界面
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsICM38FdsYkRGZkRG9lcvx2bjxiNx8VZ6l2cs0TP35ENFR1T4NGRPpHOsJGcohVYsR2MMBjVtJWd0ckW65UbM5WOHJWa5kHT20ESjBjUIF2X0hXZ0xCMx81dvRWYoNHLrdEZwZ1Rh5WNXp1bwNjW1ZUba9VZwlHdssmch1mclRXY39CXldWYtlWPzNXZj9mcw1ycz9WL49zZuBnL4AjMwUTM0kTM2AjMwAjMwIzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
三、主程式
1、讀取語音
global filep filename
[filename,filepath]=uigetfile(’*.wav’,‘選擇音頻檔案’);
filep=strcat(filepath,filename);
[y1,fs1]=wavread(filep);
namen3=filename;
D = dir(filep);
set(handles.edit1,‘string’,num2str(namen3));
namen4=[‘檔案路徑:’,num2str(filep),10, ‘檔案名:’,num2str(D.name),10,‘采樣頻率:’,num2str(fs1),10,‘檔案大小:’,num2str(D.bytes),‘bytes’,10];
set(handles.listbox1,‘string’,namen4);
axes(handles.axes1);
plot(y1);
namen=‘原始語音信号’;
set(handles.text2,‘string’,num2str(namen));
2、語音的播放
global filep
[filex,fs]=wavread(filep);
sound(filex,fs);
3、識别
global filep hmm
load hmm.mat
[x,fs]=wavread(filep);
[x1,x2]=vad(x,fs);
O = mfcc(x);
O = O(x1:x2-5,:);
for j=1:10
pout(j) = viterbi(hmm{j}, O);%調用自定義的子函數viterbi.m
end
[d,n] = max(pout);
% delete(d);
c=num2str(n-1);
set(handles.edit5,‘string’,c);
guidata(hObject, handles);
4、識别率的計算
a=zeros(1,30);b=[zeros(1,3),ones(1,3),2ones(1,3),3ones(1,3),4ones(1,3),5ones(1,3),6ones(1,3),7ones(1,3),8ones(1,3),9ones(1,3)];
for i=1:30
fname = sprintf(‘test1\%d.wav’,i);
[k,fs]=wavread(fname);
M=handles.M;
y = awgn(k,M,‘measured’);%此為加噪聲函數,第二個參數是噪聲值。
[x1,x2]=vad(y,fs);
O = mfcc(y);
O = O(x1:x2-5,:);
for j=1:10
pout(j) = viterbi(hmm{j}, O);
end
[d,n] = max(pout);
a(1,i)=n-1;
end
z=a-b;
d=sum(z==0);
e=d/30;
% fprintf(‘識别率為%d\n’, e);
set(handles.edit4,‘string’,num2str(e));
guidata(hObject,handles);