國(guó)企直簽合同。
1、具備扎實(shí)的編程技能,并且對(duì)解決復(fù)雜問(wèn)題充滿(mǎn)熱情。專(zhuān)注于大規(guī)模語(yǔ)言模型(LLM)或其他大模型(如多模態(tài)模型)的訓(xùn)練、優(yōu)化與應(yīng)用開(kāi)發(fā)。該職位將負(fù)責(zé)構(gòu)建、訓(xùn)練、調(diào)優(yōu)和部署先進(jìn)的大模型,以推動(dòng)單位在相關(guān)領(lǐng)域的技術(shù)創(chuàng)新和業(yè)務(wù)落地。
2、主要職責(zé):
(1)大模型訓(xùn)練與調(diào)優(yōu):設(shè)計(jì)、實(shí)施并優(yōu)化大模型的訓(xùn)練流程,包括數(shù)據(jù)準(zhǔn)備、模型架構(gòu)選擇、超參數(shù)調(diào)整、分布式訓(xùn)練策略制定與執(zhí)行。
(2)模型開(kāi)發(fā)與實(shí)現(xiàn):參與或主導(dǎo)大模型(如Transformer架構(gòu)模型)的研發(fā)、復(fù)現(xiàn)、改進(jìn)和適配工作。
(3)性能優(yōu)化:解決大模型訓(xùn)練中的性能瓶頸(計(jì)算、通信、內(nèi)存),進(jìn)行顯存優(yōu)化、計(jì)算效率提升和通信優(yōu)化。
(4)技術(shù)棧應(yīng)用:熟練運(yùn)用主流的大模型訓(xùn)練框架和工具(如PyTorch, TensorFlow, DeepSpeed, Megatron-LM, FSDP, Hugging Face Transformers等)。
(5)數(shù)據(jù)處理:設(shè)計(jì)和管理用于大模型訓(xùn)練的海量、高質(zhì)量數(shù)據(jù)集,包括數(shù)據(jù)清洗、預(yù)處理、增強(qiáng)和安全管理。
(6)模型部署與應(yīng)用探索:探索訓(xùn)練后模型的部署方案(如推理優(yōu)化)及其在具體業(yè)務(wù)場(chǎng)景(如智能問(wèn)答、內(nèi)容生成、代碼輔助、知識(shí)管理、AIGC等)中的應(yīng)用潛力。
(7)技術(shù)跟蹤與分享**:跟蹤大模型領(lǐng)域的前沿技術(shù)動(dòng)態(tài),并在團(tuán)隊(duì)內(nèi)進(jìn)行技術(shù)分享。
3、要求:計(jì)算機(jī)科學(xué)或相關(guān)領(lǐng)域的本科及以上學(xué)歷。
精通Python編程語(yǔ)言,具有3年以上實(shí)際項(xiàng)目開(kāi)發(fā)經(jīng)驗(yàn)。
熟悉常用的Python包和框架,如Pandas, NumPy, Flask/Django等。
具備良好的SQL知識(shí),能夠編寫(xiě)復(fù)雜的查詢(xún)語(yǔ)句。
理解數(shù)據(jù)結(jié)構(gòu)、算法知識(shí)及面向?qū)ο笤O(shè)計(jì)原則。
熟悉Linux環(huán)境,熟悉lnux常見(jiàn)命令。有使用版本控制工具(如Git)的經(jīng)驗(yàn)。優(yōu)秀的溝通能力和團(tuán)隊(duì)協(xié)作精神。
4、加分項(xiàng):
(1)在自然語(yǔ)言處理(NLP)、語(yǔ)音識(shí)別處理方面有項(xiàng)目經(jīng)驗(yàn)。
(2)參與過(guò)大模型(如Transformer架構(gòu))的開(kāi)發(fā)或應(yīng)用。
(3)對(duì)開(kāi)源社區(qū)有所貢獻(xiàn),擁有個(gè)人GitHub項(xiàng)目者優(yōu)先考慮。