基于麥克風(fēng)陣列的語音識別系統(tǒng)研究.pdf_第1頁
已閱讀1頁,還剩75頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、語音識別技術(shù)在電子、通信、工業(yè)控制、計(jì)算機(jī)和信息服務(wù)等領(lǐng)域有著廣泛的應(yīng)用和光明的發(fā)展前景。未來語音交互系統(tǒng)將成為人機(jī)對話的普通工具,故對語音識別的深入研究,順應(yīng)了市場的要求,同時(shí)也將大大推動語音技術(shù)的發(fā)展。人與機(jī)器交流和溝通壁壘的解決與突破,將為人類提供更加方便、自然、快捷的操作界面及更友好的交互方式。
  本文在分析了語音識別的研究發(fā)展現(xiàn)狀基礎(chǔ)上,提出了語音識別的改進(jìn)算法,將矢量量化(VQ)的碼本設(shè)計(jì)進(jìn)行改進(jìn)和優(yōu)化并與最小二乘支

2、持向量機(jī)(LSSVM)結(jié)合來共同構(gòu)建VQ-LSSVM二次語音識別模型??紤]到高信噪比的純凈語音信號對語音識別系統(tǒng)的影響,在語音識別系統(tǒng)的前端引入基于麥克風(fēng)聲源定位的語音增強(qiáng)算法。具體是利用麥克風(fēng)陣列的聲源定位方法來鎖定有效聲源方位參數(shù),然后根據(jù)參數(shù)對聲源方位作可控波束指向性增強(qiáng),將增強(qiáng)后的語音信號輸入語音識別系統(tǒng)進(jìn)行語音識別。最后將前端語音增強(qiáng)及后端系統(tǒng)模型識別算法植入TMS320C6713 DSK硬件平臺進(jìn)行實(shí)驗(yàn)仿真和驗(yàn)證完成系統(tǒng)設(shè)計(jì)

3、。
  本文的創(chuàng)新成果如下:
 ?。?)將搜索空間預(yù)估計(jì)的波束指向性增強(qiáng)算法引入到語音識別系統(tǒng),用以語音增強(qiáng)來提高識別系統(tǒng)輸入信號的信噪比。具體是先利用搜索空間預(yù)估計(jì)聲源定位算法得到有效聲源的方位參數(shù),再由此參數(shù)對期望方向上的信號做波束指向性增強(qiáng),從而最大程度抑制了干擾。該算法作為語音識別系統(tǒng)前端用以語音增強(qiáng),具有計(jì)算量小、抗干擾能力強(qiáng)的優(yōu)點(diǎn)。
  (2)本文在傳統(tǒng)已有的語音識別系統(tǒng)基礎(chǔ)上,采用LBG和遺傳算法(GA)

4、相結(jié)合的碼本設(shè)計(jì),并將VQ碼本設(shè)計(jì)與LSSVM模型相結(jié)合構(gòu)建VQ-LSSVM語音識別系統(tǒng)模型。系統(tǒng)通過訓(xùn)練先得到VQ模板,再求出VQ碼字與特征參數(shù)的最小失真測度,并將該測度來訓(xùn)練LSSVM模型,最終得到系統(tǒng)訓(xùn)練模板。識別時(shí)先用VQ模板對待測語音信號進(jìn)行初次識別,對于落入設(shè)定閾值內(nèi)的矢量再用LSSVM模型進(jìn)行二次識別,最終得到系統(tǒng)識別結(jié)果。
  最后,論文給出了語音識別系統(tǒng)在MTALAB及 DSP平臺上的實(shí)驗(yàn)結(jié)果和系統(tǒng)性能分析,并對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論