崗位職責(zé):
1.模型開發(fā)與訓(xùn)練: 負責(zé)從0到1構(gòu)建、訓(xùn)練和優(yōu)化機器學(xué)習(xí)/深度學(xué)習(xí)模型,解決具體的業(yè)務(wù)問題,包括但不限于:高質(zhì)量文本分類模型的開發(fā),如報告質(zhì)量評估;大型語言模型的專項微調(diào)與優(yōu)化,以在特定任務(wù)和環(huán)境中達到極致性能。
2.端到端項目交付: 獨立或協(xié)同完成整個項目生命周期,包括需求理解、數(shù)據(jù)預(yù)處理、模型開發(fā)、模型訓(xùn)練與迭代、性能評估、模型部署上線以及技術(shù)文檔編寫。
3.算法研究與創(chuàng)新: 跟蹤NLP和LLM領(lǐng)域的最新進展,并將先進技術(shù)應(yīng)用于實際項目,以提升模型效果與效率。
4.代碼與工程: 編寫高質(zhì)量、可維護、可復(fù)現(xiàn)的代碼,并遵循軟件工程最佳實踐。
任職要求:
1.統(tǒng)招本科及以上學(xué)歷,計算機科學(xué)、人工智能、電子工程、數(shù)學(xué)或相關(guān)專業(yè)。(985/211院校畢業(yè)優(yōu)先)
2.具備 3年及以上開發(fā)經(jīng)驗,有完整的機器學(xué)習(xí)項目從設(shè)計到部署的實踐經(jīng)驗,尤其是LLM或其他NLP模型的實踐經(jīng)驗。
3.熟練掌握python等編程語言,熟悉模型微調(diào)、推理部署、輕量化開發(fā)等流程。熟練掌握Pytorch、Tensorflow等深度學(xué)習(xí)訓(xùn)練框架,具有一定強化學(xué)習(xí)應(yīng)用經(jīng)驗。
4.具備優(yōu)秀的英文技術(shù)文檔閱讀與學(xué)術(shù)論文理解能力,能無障礙地使用英文進行技術(shù)方案撰寫與郵件溝通。