崗位職責(zé):
1.負(fù)責(zé)多模態(tài)圖像大模型的預(yù)訓(xùn)練、微調(diào)與評(píng)估,包括LLM、Diffusion、Vision-Language模型等;
2.參與構(gòu)建和優(yōu)化模型訓(xùn)練數(shù)據(jù)集,包括文本、圖像、圖文對(duì)等;
3.負(fù)責(zé)訓(xùn)練框架的開發(fā)與優(yōu)化,如分布式訓(xùn)練、混合精度訓(xùn)練、參數(shù)高效微調(diào)(LoRA、PEFT 等);
4.跟進(jìn)前沿研究,推動(dòng)模型性能優(yōu)化和推理效率提升;
5.與產(chǎn)品、算法、后端等團(tuán)隊(duì)緊密合作,推動(dòng)模型落地。
任職要求:
1.計(jì)算機(jī)、人工智能、圖像處理、自然語言處理等相關(guān)專業(yè)本科及以上學(xué)歷,優(yōu)秀者可放寬;
2.熟悉大模型架構(gòu)(如Transformer、Diffusion、CLIP、BLIP、SD等),并有實(shí)際訓(xùn)練經(jīng)驗(yàn);
3.熟練掌握 PyTorch、Transformers、Diffusers、DeepSpeed、Accelerate 等主流框架;
4.具備多模態(tài)數(shù)據(jù)處理與標(biāo)注經(jīng)驗(yàn),有AIGC相關(guān)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先;
5.具備良好的工程實(shí)現(xiàn)能力和團(tuán)隊(duì)協(xié)作精神;
6.有較強(qiáng)的英文文獻(xiàn)閱讀和技術(shù)文檔撰寫能力。
加分項(xiàng):
1.有開源項(xiàng)目經(jīng)驗(yàn)或在頂會(huì)發(fā)表論文;
2.了解 Stable Diffusion、SDXL、LLaVA、MiniGPT-4、InternLM-XComposer 等項(xiàng)目;
3.有AI繪圖或文生圖產(chǎn)品開發(fā)經(jīng)驗(yàn)者優(yōu)先。