【崗位職責(zé)】
1.參與人工智能相關(guān)算法開發(fā),包括大語言模型預(yù)訓(xùn)練、全參數(shù)微調(diào)與高效參數(shù)微調(diào)訓(xùn)練(如Lora、P-tuning等)、PPO/DPO等強(qiáng)化學(xué)習(xí)訓(xùn)練;多模態(tài)大模型預(yù)訓(xùn)練,深入理解多模態(tài)對(duì)齊融合機(jī)理,進(jìn)行Qformer或mlp對(duì)齊實(shí)驗(yàn)。
2.參與數(shù)據(jù)合成工作,包括SD圖像生成,深入理解擴(kuò)散模型底層原理,有文生圖模型預(yù)訓(xùn)練經(jīng)驗(yàn)。
3.負(fù)責(zé)進(jìn)行前沿強(qiáng)化學(xué)習(xí)實(shí)驗(yàn),深入理解思維鏈、獎(jiǎng)勵(lì)黑客等原理。
4.參與大模型訓(xùn)練框架優(yōu)化,熟練掌握Megatron,deepspeed等訓(xùn)練框架,運(yùn)用并調(diào)優(yōu)數(shù)據(jù)并行、張量并行、流水線并行等多維度并行策略。
5. 參與大模型智能體開發(fā)、RAG開發(fā)優(yōu)化、自然語言處理、計(jì)算機(jī)視覺等項(xiàng)目;
6.參與業(yè)務(wù)場(chǎng)景調(diào)研,進(jìn)行具體算法優(yōu)化及效果驗(yàn)證;
7.參與模型推理部署,低精度量化等工作,與產(chǎn)品、后端配合,將算法封裝成服務(wù),供用戶調(diào)用。
【任職要求】
1.擁有人工智能、大數(shù)據(jù)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、電子信息等相關(guān)專業(yè)本科及以上學(xué)歷。擁有人工智能相關(guān)工作經(jīng)驗(yàn)5年及以上。
2.具備在大型科技公司或互聯(lián)網(wǎng)公司從業(yè)經(jīng)驗(yàn),對(duì)算法有深刻理解,精通人工智能相關(guān)技術(shù),包括但不限于機(jī)器學(xué)習(xí),深度學(xué)習(xí),自然語言處理、計(jì)算機(jī)視覺、大語言模型、多模態(tài)大模型、數(shù)字人等。
3.掌握Transformer基本原理,精通NLP、AIGC、語音識(shí)別等算法,熟悉知名開源大模型(如Llama、chatGLM、百川、Qwen等)設(shè)計(jì)流程優(yōu)先。
4.具備大模型應(yīng)用開發(fā)經(jīng)驗(yàn),有RAG/NL2SQL/Agent等模塊開發(fā)與應(yīng)用落地經(jīng)驗(yàn)。
5.精通大模型的分布式系統(tǒng)和多GPU優(yōu)化。
6.熟練掌握python等編程語言,熟悉模型微調(diào)、推理部署、輕量化開發(fā)等流程,
7.熟練掌握Pytorch、Tensorflow等深度學(xué)習(xí)訓(xùn)練框架,具有一定強(qiáng)化學(xué)習(xí)應(yīng)用經(jīng)驗(yàn)。
8.具有較強(qiáng)的業(yè)務(wù)學(xué)習(xí)能力,能夠?qū)?fù)雜行業(yè)場(chǎng)景進(jìn)行問題梳理,細(xì)化開發(fā)流程。
9.有較強(qiáng)的抗壓能力,能夠完成領(lǐng)導(dǎo)安排的其他工作。