崗位職責(zé)
1.主導(dǎo)代碼大模型的架構(gòu)設(shè)計(jì)與研發(fā)工作,參與模型核心算法的迭代優(yōu)化?;
2.深度參與大模型原理研究,制定針對(duì)性的微調(diào)策略,重點(diǎn)提升模型在代碼生成、邏輯推理、多語言支持等任務(wù)中的效果?;
3.負(fù)責(zé)模型訓(xùn)練全流程管控,包括數(shù)據(jù)去重、預(yù)處理、訓(xùn)練參數(shù)調(diào)優(yōu)及算子優(yōu)化等關(guān)鍵環(huán)節(jié)?;
4.推動(dòng)研發(fā)成果在實(shí)際項(xiàng)目中的落地應(yīng)用,跟進(jìn)技術(shù)驗(yàn)證與問題修復(fù),確保模型性能達(dá)標(biāo)。
任職要求
1.211/985 院校研究生及以上學(xué)歷(在讀、應(yīng)屆或畢業(yè)五年內(nèi)均可)計(jì)算機(jī)科學(xué)、人工智能、軟件工程等相關(guān)專業(yè)優(yōu)先?;
2.具備代碼生成大模型或其他大模型微調(diào)相關(guān)項(xiàng)目經(jīng)驗(yàn),熟悉模型訓(xùn)練全流程(數(shù)據(jù)處理 - 模型調(diào)優(yōu) - 效果驗(yàn)證)?;
3.?精通 Python/C++ 編程語言,能獨(dú)立完成算法代碼實(shí)現(xiàn)與工程化落地?
熟悉 CUDA、TVM 或 OpenCL 等加速框架,了解 GPU 并行計(jì)算原理?;擁有扎實(shí)的算法推導(dǎo)能力與工程實(shí)踐經(jīng)驗(yàn),能解決模型訓(xùn)練中的復(fù)雜技術(shù)問題?;
4.協(xié)作能力:具備優(yōu)秀的遠(yuǎn)程協(xié)作意識(shí)與獨(dú)立推進(jìn)能力,能在無現(xiàn)場(chǎng)監(jiān)督的情況下高效完成工作任務(wù)。
亮點(diǎn)
1.彈性工作時(shí)間,無需坐班,平衡工作與個(gè)人安排,遠(yuǎn)程線上協(xié)作,通過視頻會(huì)議、即時(shí)通訊工具同步項(xiàng)目進(jìn)展?;
2.清晰的任務(wù)目標(biāo)與合理的交付周期,避免無效加班;
3.項(xiàng)目結(jié)束后可獲得項(xiàng)目參與證明,優(yōu)秀貢獻(xiàn)者有機(jī)會(huì)建立長(zhǎng)期合作關(guān)系。