崗位職責:
1、負責醫(yī)療健康領域大模型的SFT,構建高質量的指令數(shù)據(jù)集,提升模型的任務執(zhí)行能力。
2、主導設計醫(yī)療健康大模型強化學習訓練框架,持續(xù)提升模型在醫(yī)療健康領域的推理能力。
3、設計和實施全面的模型評測體系,從多維度追蹤模型的迭代效果。
4、跟進業(yè)界最新的大模型訓練與對齊技術,進行預研和實踐,持續(xù)提升核心模型的能力邊界。
5、負責大模型訓練加速與推理優(yōu)化,應用量化、蒸餾等技術實現(xiàn)工業(yè)級部署。
6、完成上級安排的相關工作。
任職要求:
1、計算機相關專業(yè)本科及以上學歷,3年以上大模型或NLP相關技術研發(fā)經(jīng)驗。
2、具備大語言模型訓練的實戰(zhàn)經(jīng)驗,特別是SFT和RL等技術。
3、有強化學習項目實戰(zhàn)經(jīng)驗,熟悉強化學習算法從研發(fā)到落地的全流程。
4、精通PyTorch等深度學習框架和分布式訓練技術(如DeepSpeed)。
5、對Transformer模型結構有深刻理解,對大模型訓練中的數(shù)據(jù)、算法、算力有系統(tǒng)性認知。
6、在國際頂會發(fā)表相關論文者優(yōu)先。
7、對新技術有強烈的熱愛、好奇心和鉆研精神,具備卓越的團隊協(xié)作、溝通和問題解決能力,自驅、富有責任心和主人翁精神,極致追求算法創(chuàng)新和產(chǎn)品效果。