崗位職責(zé):
1、負(fù)責(zé)公司音頻模型的訓(xùn)練與優(yōu)化,對(duì)音頻數(shù)據(jù)進(jìn)行特征提取、標(biāo)注預(yù)處理,并進(jìn)行數(shù)據(jù)增強(qiáng)與數(shù)據(jù)集構(gòu)建;
2、基于 PyTorch / TensorFlow 等深度學(xué)習(xí)框架,進(jìn)行音頻時(shí)頻域建模、空間重建等神經(jīng)網(wǎng)絡(luò)算法開發(fā);
3、參與模型壓縮(如INT8量化)、推理加速及異構(gòu)部署(GPU/NPU)適配;
4、跟進(jìn)模型在車載、PC、移動(dòng)端等不同場景的部署需求,配合工程團(tuán)隊(duì)進(jìn)行模型聯(lián)調(diào)測試;
5、跟蹤行業(yè)前沿研究(音頻分離、空間定位、HRTF重建等),轉(zhuǎn)化為可落地能力。
任職要求:
1、碩士及以上學(xué)歷,信號(hào)處理、人工智能、聲學(xué)、計(jì)算機(jī)等相關(guān)專業(yè);
2、具備 2 年以上音頻/語音方向深度學(xué)習(xí)模型訓(xùn)練經(jīng)驗(yàn);
3、熟悉深度學(xué)習(xí)常見網(wǎng)絡(luò)結(jié)構(gòu)(如UNet、ResNet、Transformer),有音頻建模(如源分離、聲源定位、空間音頻)經(jīng)驗(yàn)優(yōu)先;
4、熟練使用 Python、PyTorch/TensorFlow、librosa、ffmpeg 等工具;
5、了解音樂結(jié)構(gòu)、聲學(xué)特征,具備實(shí)際音頻處理項(xiàng)目經(jīng)驗(yàn)者優(yōu)先;
6、具備獨(dú)立完成音頻模型開發(fā)與部署的能力,包括數(shù)據(jù)處理、模型設(shè)計(jì)、訓(xùn)練優(yōu)化及推理落地。
7、有良好的溝通協(xié)作能力與工程化思維,熱愛音頻與創(chuàng)新技術(shù);
加分項(xiàng):
1、有環(huán)繞聲、空間音頻、虛擬現(xiàn)實(shí)音頻等模型或產(chǎn)品經(jīng)驗(yàn);
2、有比賽、開源項(xiàng)目或論文成果優(yōu)先;
3、熟悉 Onnx、Triton、CUDA、TensorRT 等推理優(yōu)化工具優(yōu)先。