W3Cschool
恭喜您成為首批注冊(cè)用戶
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
在本章中,我們將學(xué)習(xí)使用 AI 和 Python 進(jìn)行語音識(shí)別。 言語是成人人際溝通的最基本手段。 語音處理的基本目標(biāo)是提供人與機(jī)器之間的交互。 語音處理系統(tǒng)主要有三項(xiàng)任務(wù) -
本章重點(diǎn)講述語音識(shí)別,理解人類說話的過程。 請(qǐng)記住,在麥克風(fēng)的幫助下捕捉語音信號(hào),然后系統(tǒng)才能理解它。
語音識(shí)別或自動(dòng)語音識(shí)別(ASR)是 AI 機(jī)器人等 AI 項(xiàng)目的關(guān)注焦點(diǎn)。 沒有 ASR,就不可能想象一個(gè)認(rèn)知機(jī)器人與人進(jìn)行交互。 但是,構(gòu)建語音識(shí)別器并不容易。
開發(fā)語音識(shí)別系統(tǒng)的困難 開發(fā)高質(zhì)量的語音識(shí)別系統(tǒng)確實(shí)是一個(gè)難題。 語音識(shí)別技術(shù)的困難可以廣泛地表征為如下所討論的許多維度 -
- 詞匯大小影響開發(fā) ASR 的難易程度。考慮以下詞匯量以便更好地理解。
- 噪音是開發(fā) ASR 時(shí)需要考慮的另一個(gè)因素。 信噪比可以在各種范圍內(nèi),這取決于觀察較少的聲學(xué)環(huán)境與較多的背景噪聲 -
盡管存在這些困難,研究人員在語音的各個(gè)方面做了很多工作,例如理解語音信號(hào),說話人以及識(shí)別口音。
所以,需要按照以下步驟構(gòu)建語音識(shí)別器 -
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: