專業(yè)能力、價(jià)值觀匹配,則不受此薪酬范圍
一、核心工作內(nèi)容
1、在部門經(jīng)理的指導(dǎo)下參與大模型的設(shè)計(jì)、開發(fā)、訓(xùn)練和優(yōu)化,提升模型的性能和效率,包括模型并行、數(shù)據(jù)并行、流水線并行等設(shè)計(jì)與開發(fā);
2、參與大模型數(shù)據(jù)構(gòu)建,能夠負(fù)責(zé)有效的高質(zhì)量數(shù)據(jù)生產(chǎn)、整理和清洗工作,對數(shù)據(jù)正確性提供判斷,對模型生成內(nèi)容正確性提供判斷,對模型進(jìn)行內(nèi)容改進(jìn)策略建議;
3、管理和優(yōu)化數(shù)據(jù)處理流程,確保數(shù)據(jù)的質(zhì)量和可用性,編寫數(shù)據(jù)方案及標(biāo)注方案,熟練掌握數(shù)據(jù)集優(yōu)化方法;
4、在部門經(jīng)理的指導(dǎo)下持續(xù)跟蹤AI領(lǐng)域,尤其是大模型和深度學(xué)習(xí)的最新進(jìn)展,將前沿技術(shù)應(yīng)用于實(shí)際問題解決,探索和實(shí)驗(yàn)新技術(shù),不斷創(chuàng)新以提升算法性能和應(yīng)用效果;
5、完成上級領(lǐng)導(dǎo)布置的專項(xiàng)或臨時(shí)支撐工作。
二、崗位核心能力要求
1、核心工作內(nèi)容相關(guān)的專業(yè)能力:熟悉至少一種深度學(xué)習(xí)框架(PaddlePaddle、PyTorch、TensorFlow、Caffe等);熟練使用Linux系統(tǒng),熟練使用c++、python等語言,精通常用算法和數(shù)據(jù)結(jié)構(gòu),對常見的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法有較強(qiáng)的實(shí)踐能力;對大模型分布式訓(xùn)練有經(jīng)驗(yàn),熟悉DeepSpeed/Megatron/ColossalAI等加速框架,熟悉數(shù)據(jù)并行DP,流水線并行PP,模型張量并行MP等3D并行技術(shù);對類似OPT/BLOOM/LLaMA/GLM等大模型訓(xùn)練的穩(wěn)定性、收斂性有了解或?qū)嵺`;
2、學(xué)習(xí)能力:學(xué)習(xí)能力強(qiáng),善于提煉總結(jié),能快速掌握前沿算法、創(chuàng)新架構(gòu),深度鉆研海量數(shù)據(jù)處理與模型優(yōu)化技巧,借由追蹤學(xué)術(shù)成果、參與技術(shù)研討,持續(xù)更新知識體系,提升開發(fā)實(shí)操水平;
3、合作能力:具備良好合作能力,工作中與與算法團(tuán)隊(duì)協(xié)同優(yōu)化模型架構(gòu)、和數(shù)據(jù)團(tuán)隊(duì)配合處理海量數(shù)據(jù)、跟產(chǎn)品經(jīng)理溝通明確功能需求,能始終保持高效溝通、積極協(xié)作,保障大模型開發(fā)項(xiàng)目穩(wěn)步推進(jìn)。
三、崗位任職要求
1、本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè)優(yōu)先;
2、價(jià)值取向和性格特點(diǎn):具備耐心沉穩(wěn)、善于鉆研的性格特點(diǎn),在工作中秉持追求技術(shù)卓越、用創(chuàng)新賦能產(chǎn)業(yè)的價(jià)值取向,全身心投入大模型開發(fā),不斷突破技術(shù)瓶頸,推動(dòng)行業(yè)發(fā)展;
3、專業(yè)履歷要求:3年以上大模型開發(fā)經(jīng)驗(yàn),有開源大模型優(yōu)化和部署的實(shí)戰(zhàn)經(jīng)驗(yàn)者優(yōu)先,熟悉模型訓(xùn)練、微調(diào)和各種微調(diào)方法。