字節(jié)跳動(dòng) 音頻算法工程師(抖音智能對(duì)話機(jī)器人)-Data

2025-06-10 17:15 更新
  • 深圳
  • 正式
  • 研發(fā) - 算法
  • 職位 ID:A217930


職位描述

1、負(fù)責(zé)為抖音客服業(yè)務(wù)VOIP和熱線等語音交互場景提供專業(yè)的音頻技術(shù)支持與研發(fā),運(yùn)用端到端的語音大模型實(shí)現(xiàn)更高效、智能的客服音頻交互體驗(yàn); 

2、負(fù)責(zé)端到端語音大模型在客服應(yīng)用中的落地與優(yōu)化,搭建智能音頻理解和處理在客服領(lǐng)域的系統(tǒng)級(jí)解決方案; 

3、跟進(jìn)客服產(chǎn)品業(yè)務(wù)的語音/音頻需求,持續(xù)改進(jìn)產(chǎn)品的音頻質(zhì)量體驗(yàn);結(jié)合實(shí)際業(yè)務(wù)場景,對(duì)模型進(jìn)行針對(duì)性訓(xùn)練和調(diào)優(yōu),確保語音識(shí)別、合成等功能能精準(zhǔn)適配客服對(duì)話需求,提升對(duì)話理解和回復(fù)的準(zhǔn)確性; 

4、跟蹤研發(fā)業(yè)界先進(jìn)的音頻進(jìn)展,探索語音/音頻領(lǐng)域最新技術(shù)的研發(fā)并落地產(chǎn)品。


職位要求

1、深入理解端到端語音大模型的原理和架構(gòu),熟悉常見的語音大模型,如Whisper等,對(duì)語音識(shí)別、合成、對(duì)話理解等技術(shù)有扎實(shí)的理論基礎(chǔ); 

2、具備優(yōu)秀的編程能力,熟練使用Python等主流編程語言,熟悉深度學(xué)習(xí)框架,如PyTorchTensorFlow,能夠進(jìn)行模型的開發(fā)、訓(xùn)練和部署; 

3、有語音大模型實(shí)際應(yīng)用項(xiàng)目經(jīng)驗(yàn),特別是在音頻通信、客服系統(tǒng)等領(lǐng)域,有相關(guān)經(jīng)驗(yàn)者優(yōu)先; 

4、在語音處理、人工智能相關(guān)領(lǐng)域的高水平會(huì)議和期刊,如ICASSP、Interspeech等發(fā)表過論文,或在相關(guān)競賽中取得優(yōu)異成績者優(yōu)先。





課程推薦


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)