隨著大規(guī)模集成電路技術(shù)和半導(dǎo)體技術(shù)的發(fā)展,1982年世界上誕生了第一代dsp芯片tms32010及其系列產(chǎn)品。這種dsp器件采用微米工藝nmos技術(shù)制作,雖功耗和尺寸稍大,但運算速度卻比微處理器快了幾十倍,尤其在語言合成和編碼譯碼器中得到了非常廣泛應(yīng)用。
dsp芯片的問世是個里程碑,它標(biāo)志著dsp應(yīng)用系統(tǒng)由大型系統(tǒng)向小型化邁進了一大步。至80年代中期,隨著cmos工藝的dsp芯片應(yīng)運而生,其存儲容量和運算速度都得到成倍提高,成為語音處理、圖像硬件處理技術(shù)的基礎(chǔ)。
80年代后期,第三代dsp芯片問世,運算速度進一步提高,其應(yīng)用范圍逐步擴大到通信、計算機領(lǐng)域。90年代dsp發(fā)展最快,相繼出現(xiàn)了第四代和第五代dsp器件。
第五代產(chǎn)品,它與第四代相比,系統(tǒng)集成度更高,將dsp芯核及外圍元件綜合集成在單一芯片上。這種集成度極高的dsp芯片不僅在通信、計算機領(lǐng)域大顯身手,而且逐漸滲透到人們的日常生活領(lǐng)域。經(jīng)過40多年的發(fā)展,dsp產(chǎn)品的應(yīng)用已擴大到人們的學(xué)習(xí)、工作和生活的各個方面,并逐步成為電子產(chǎn)品更新?lián)Q代的決定因素。
而語音信號處理是信號處理中的重要分支之一。
它包括的主要方面有:語音的識別,語言的理解,語音的合成,語音的增強,語音的數(shù)據(jù)壓縮等。各種應(yīng)用均有其特殊問題。語音識別是將待識別的語音信號的特征參數(shù)即時地提取出來,與已知的語音樣本進行匹配,從而判定出待識別語音信號的音素屬性。
關(guān)于語音識別方法,有統(tǒng)計模式語音識別,結(jié)構(gòu)和語句模式語音識別,利用這些方法可以得到共振峰頻率、音調(diào)、嗓音、噪聲等重要參數(shù),語音理解是人和計算機用自然語言對話的理論和技術(shù)基礎(chǔ)。語音合成的主要目的是使計算機能夠講話。
為此,首先需要研究清楚在發(fā)音時語音特征參數(shù)隨時間的變化規(guī)律,然后利用適當(dāng)?shù)姆椒M發(fā)音的過程,合成為語言。其他有關(guān)語言處理問題也各有其特點。語音信號處理是發(fā)展智能計算機和智能機器人的基礎(chǔ),是制造聲碼器的依據(jù)。語音信號處理是迅速發(fā)展中的一項信號處理技術(shù)。
那么在設(shè)計完成聽覺系統(tǒng)的電路架構(gòu)和系統(tǒng)之后,還有一個最重要的功能,那就是需要進行語音識別,就像人類一樣,需要不斷地進行學(xué)習(xí),才能不斷地對不斷派生的新的詞語有更深入地了解。
那么,什么是語音識別呢?
簡單地說,語音識別,就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。
所涉及的理論領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
所涉及到的行業(yè)領(lǐng)域包括但不限于工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域。
內(nèi)容未完,下一頁繼續(xù)閱讀