崗位職責(zé):
1.負(fù)責(zé)大規(guī)模預(yù)訓(xùn)練模型的研發(fā)工作,包括架構(gòu)設(shè)計(jì)、訓(xùn)練優(yōu)化、分布式加速等核心技術(shù)攻關(guān) ;
2.主導(dǎo)大模型在具體業(yè)務(wù)場景(NLP/CV/多模態(tài)/生理信號(hào)等)的應(yīng)用落地,設(shè)計(jì)創(chuàng)新解決方案 ;
3.構(gòu)建模型微調(diào)、提示工程、模型壓縮等工業(yè)化應(yīng)用技術(shù)體系;
4.與產(chǎn)品、數(shù)據(jù)、工程團(tuán)隊(duì)緊密協(xié)作,推動(dòng)算法到產(chǎn)品的全流程落地 ;
5.跟蹤學(xué)術(shù)界與工業(yè)界前沿技術(shù)動(dòng)態(tài),探索大模型領(lǐng)域創(chuàng)新方向 。
任職要求:
【硬性條件】
1.計(jì)算機(jī)/數(shù)學(xué)/ 人工智能相關(guān)專業(yè)統(tǒng)招碩士及以上學(xué)歷 ;
2.兩年以上大模型及五年以上AI算法相關(guān)研發(fā)經(jīng)驗(yàn) ;
3.深入理解Transformer/BERT/GPT等架構(gòu),掌握PyTorch/TensorFlow框架
4.具備分布式訓(xùn)練實(shí)戰(zhàn)經(jīng)驗(yàn)(Megatron/DeepSpeed/FairScale等) ;
5.熟悉主流大模型技術(shù)棧(LangChain/LLAMA/擴(kuò)散模型等)。
【核心能力】
1.扎實(shí)的算法基礎(chǔ):精通 機(jī)器學(xué)習(xí) / 深度學(xué)習(xí) 理論,代碼實(shí)現(xiàn)能力強(qiáng)(LeetCode中級(jí)以上);
2.工程落地能力:具有億級(jí)參數(shù)模型訓(xùn)練調(diào)優(yōu)經(jīng)驗(yàn),熟悉模型服務(wù)化部署
3.業(yè)務(wù)洞察力:能準(zhǔn)確理解業(yè)務(wù)需求,設(shè)計(jì)合理的模型應(yīng)用方案 ;
4.團(tuán)隊(duì)協(xié)作力:優(yōu)秀的跨團(tuán)隊(duì)溝通能力,能有效協(xié)調(diào)多方資源推進(jìn)項(xiàng)目。
優(yōu)先條件:
△在ACL/NeurIPS/CVPR等頂會(huì)發(fā)表過相關(guān)論文
△有開源項(xiàng)目核心貢獻(xiàn)或Kaggle等競賽top成績
△具備多模態(tài)大模型/強(qiáng)化學(xué)習(xí)/知識(shí)圖譜交叉經(jīng)驗(yàn)
△熟悉中醫(yī)/醫(yī)療/ 生物醫(yī)藥 等垂直領(lǐng)域知識(shí)者優(yōu)先
此職位為專家方向和工程師職位同步招聘,通過面試情況定崗,專家級(jí)直接匯報(bào)總裁,薪酬OPEN可再溝通