職位名稱:算法實習(xí)生(音視頻與語音技術(shù)方向)
職位描述:
我們正在尋找一位對音視頻處理、語音識別、語音合成、大模型文本翻譯及口唇同步等技術(shù)充滿熱情的算法實習(xí)生。加入我們的團隊,你將有機會參與前沿AI技術(shù)的研發(fā)與落地,探索多模態(tài)交互的未來。
工作職責(zé):
1. 參與音視頻信號處理算法的研究與優(yōu)化,包括但不限于語音增強、降噪、回聲消除等。
2. 探索語音識別(ASR)和語音合成(TTS)技術(shù),優(yōu)化模型性能與實時性。
3. 研究大語言模型(LLM)在文本翻譯、語音生成等任務(wù)中的應(yīng)用與優(yōu)化。
4. 開發(fā)口唇同步(Lip Sync)技術(shù),提升虛擬人的自然交互體驗。
5. 協(xié)助團隊進行算法部署與性能調(diào)優(yōu),推動技術(shù)在實際場景中的應(yīng)用。
任職要求:
1. 學(xué)歷背景:計算機科學(xué)、人工智能、電子工程、信號處理等相關(guān)專業(yè)的碩士或博士在讀生。
2.技術(shù)能力:
- 熟悉Python/C++,具備扎實的編程和算法基礎(chǔ)。
- 熟悉深度學(xué)習(xí)框架(如PyTorch、TensorFlow),有語音/視頻相關(guān)項目經(jīng)驗者優(yōu)先。
- 了解語音識別(如Whisper)、語音合成(如VITS)、大模型(如GPT、LLaMA)或口唇同步(如Wav2Lip)等技術(shù)。
- 有音視頻編解碼(FFmpeg)、信號處理或多媒體開發(fā)經(jīng)驗者加分。
3. 學(xué)習(xí)能力:對AI技術(shù)有強烈興趣,具備快速學(xué)習(xí)新技術(shù)的能力。
4. 團隊協(xié)作:良好的溝通能力,能與團隊高效配合。
加分項:
- 在頂級會議(ICASSP、Interspeech、CVPR等)發(fā)表過相關(guān)論文。
- 有開源項目貢獻或相關(guān)競賽(如Kaggle)獲獎經(jīng)歷。
實習(xí)收獲:
- 深入?yún)⑴cAI前沿技術(shù)的研發(fā),積累實戰(zhàn)經(jīng)驗。
- 與行業(yè)頂尖團隊共事,獲得專業(yè)指導(dǎo)。
- 表現(xiàn)優(yōu)異者有機會獲得轉(zhuǎn)正機會。
工作地點 & 時間:
- 地點:可遠程或線下(具體根據(jù)公司政策)
- 時長:3個月及以上,每周至少4天
---
如何申請:
請將簡歷、項目/論文鏈接發(fā)送至:[郵箱地址],郵件標(biāo)題注明“算法實習(xí)生申請-姓名-學(xué)?!?。