崗位職責(zé):
1、負(fù)責(zé)領(lǐng)域大模型的微調(diào)、優(yōu)化,提升模型在具體任務(wù)上的性能和泛化能力。
2、參與訓(xùn)練的數(shù)據(jù)構(gòu)建及質(zhì)量評(píng)估方案設(shè)計(jì),確保訓(xùn)練數(shù)據(jù)的有效性。
3、參與模型評(píng)估指標(biāo)和方案設(shè)計(jì),分析模型表現(xiàn)和設(shè)計(jì)改進(jìn)方法。
4、研究并應(yīng)用主流的模型微調(diào)技術(shù)及強(qiáng)化學(xué)習(xí)方法(如PPO、DPO等)進(jìn)行模型創(chuàng)新性改進(jìn);
5、熟悉模型infra基礎(chǔ)知識(shí),與相關(guān)團(tuán)隊(duì)緊密協(xié)作,共同推動(dòng)模型訓(xùn)練能力提升和推理加速。
任職要求:
1、本科及以上學(xué)歷,人工智能、計(jì)算機(jī)科學(xué)等相關(guān)專(zhuān)業(yè);
2、扎實(shí)掌握深度學(xué)習(xí)理論基礎(chǔ),熟悉大模型的底層原理;
3、熟練掌握至少一種深度學(xué)習(xí)框架,具備一些模型訓(xùn)練與調(diào)優(yōu)經(jīng)驗(yàn);
4、良好的編程能力和工程實(shí)現(xiàn)能力,熟練使用Python,有良好的代碼規(guī)范;
5、熟悉常見(jiàn)的大模型微調(diào)技術(shù)以及強(qiáng)化學(xué)習(xí)相關(guān)算法;
6、熟悉數(shù)據(jù)預(yù)處理流程,包括數(shù)據(jù)清洗、標(biāo)注、格式轉(zhuǎn)換、語(yǔ)料構(gòu)建等;
7、熟悉模型基礎(chǔ)架構(gòu)設(shè)計(jì)和具備相關(guān)優(yōu)化經(jīng)驗(yàn)者優(yōu)先;
8、有開(kāi)源項(xiàng)目貢獻(xiàn)經(jīng)歷或大型模型訓(xùn)練調(diào)優(yōu)實(shí)戰(zhàn)經(jīng)驗(yàn)者優(yōu)先;