這些聲音的資訊,現(xiàn)在重新被編碼,透過部分的腦干例如,耳蝸核和下丘沿著聽覺神經(jīng)移下,進(jìn)一步在各個(gè)小站被處理。資訊最終到達(dá)丘腦,并且從那里它被傳遞到腦皮層。
那么,作為仿生學(xué)的人工智能,就需要用電子元件來實(shí)現(xiàn)聲音的采集、傳輸、編碼、轉(zhuǎn)換和譯碼,然后以顯示屏來代替大腦的感知來顯示收集到的聲音所代表的文字或物體。
另外,代替大腦感知的還應(yīng)該有一個(gè)芯片或芯片組,來分析和處理所聽到的聲音中,那些是需要過濾掉的,哪些是需要送到下一個(gè)部件進(jìn)行具體處理的。
如果,楊小樂能將這個(gè)聽覺系統(tǒng)設(shè)計(jì)得如同設(shè)想的一樣,那么就標(biāo)志著他已經(jīng)踏進(jìn)了人工智能的殿堂,因?yàn)?,語言就是一個(gè)具備模糊和不確定、并且阻擾機(jī)器智能化的因素之一。
就比如,我們平常聊天時(shí)一樣,我們把別人說的話經(jīng)耳朵送入大腦后,經(jīng)大腦分析和思考之后,確定哪些詞我們需要注意、并回答,哪些可以忽略。
所以,如何將人說的話,通過聲電轉(zhuǎn)換,再編碼成一定格式的數(shù)據(jù)流,然后在芯片或芯片組中譯碼還原,并與數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行比對,提取出對應(yīng)的字庫,一路送到顯示屏進(jìn)行顯示,另一路送到邏輯分析電路,對這句句話進(jìn)行分析,以判斷是否需要對這句話進(jìn)行處理。
那么,問題就來了,聲電轉(zhuǎn)換之后,編成什么樣的格式?芯片或芯片組能用現(xiàn)成的cpu芯片嗎?需要對應(yīng)的操作系統(tǒng)嗎?數(shù)據(jù)庫怎么建立?字庫是硬件化還是軟件化?怎么設(shè)計(jì)邏輯分析電路?是用cpu加操作系統(tǒng)還是另外設(shè)計(jì)?
楊小樂躺在床上,越想越頭疼,越想越是勇氣不足。
前世的機(jī)器人聽覺系統(tǒng)主要是對人的聲音進(jìn)行語音識(shí)別并做出判斷,然后輸出相應(yīng)的動(dòng)作指令控制頭部和手臂的動(dòng)作,傳統(tǒng)的機(jī)器人聽覺系統(tǒng)一般是以pc機(jī)為平臺(tái)對機(jī)器人進(jìn)行控制,其特點(diǎn)是用一臺(tái)計(jì)算機(jī)作為機(jī)器人的信息處理核心通過接口電路對機(jī)器人進(jìn)行控制,雖然處理能力比較強(qiáng)大,語音庫比較完備,系統(tǒng)更新以及功能拓展比較容易,但是比較笨重,不利于機(jī)器人的小型化和復(fù)雜條件下進(jìn)行工作,此外功耗大、成本高。
小型化和復(fù)雜條件下工作的機(jī)器人的聽覺系統(tǒng),在前世基本上都是由于微型處理器性能的提高促進(jìn)了機(jī)器人的迅速發(fā)展,特別是大存儲(chǔ)量及高速運(yùn)算dsp處理芯片的出現(xiàn)使機(jī)器人在脫機(jī)狀態(tài)下,獨(dú)立完成復(fù)雜的語音信號處理和動(dòng)作指令成為可能。
因此數(shù)字信號處理dsp的出現(xiàn),簡化了機(jī)器人聽覺系統(tǒng)的電路結(jié)構(gòu),只有四個(gè)組件就構(gòu)成了聽覺系統(tǒng):麥克風(fēng)、語音處理芯片、dsp芯片和數(shù)據(jù)庫fsh芯片,而聽覺系統(tǒng)的大腦就是fpga芯片。
內(nèi)容未完,下一頁繼續(xù)閱讀