崗位描述:
每一個可靠的中醫(yī)大模型背后,是海量專業(yè)數(shù)據(jù)的淬煉,這要求我們從典籍脈絡的解構中提煉辨證邏輯,從臨床診療的推演中構建決策鏈條,這是一個中醫(yī)學術體系與AI數(shù)據(jù)科學深度交叉的復雜工程。
我們的目標是讓數(shù)據(jù)成為模型理解中醫(yī)哲學、辨證邏輯與方劑應用的“源泉”,并推動其從文本生成向中醫(yī)認知智能躍遷。
我們需要您利用預訓練、微調、對齊技術,訓練出可落地于實際診療場景的中醫(yī)臨床大模型。
崗位職責:
1. 大模型訓練及優(yōu)化
- 主導基座大模型的選型評估
- 設計訓練策略,實現(xiàn)訓練流程
- 執(zhí)行中醫(yī)臨床大模型預訓練、微調、對齊工作
- 基于多維度的大模型評估結果,持續(xù)性優(yōu)化模型表現(xiàn)
2. 大模型業(yè)務落地工作
- 收集實際臨床效果反饋數(shù)據(jù),驅動模型迭代優(yōu)化
- 研發(fā)基于大模型的中醫(yī)智能體,針對特定任務提升應用效果
3. 數(shù)據(jù)工程與質量評估工作
- 建立訓練數(shù)據(jù)質量評估方案,確保數(shù)據(jù)對模型學習的有效性
- 優(yōu)化多源異構數(shù)據(jù)處理管道
職位要求:
1. 學歷:計算機科學、人工智能、數(shù)學或醫(yī)學相關專業(yè)碩士及以上學歷。
2. 經驗:
- 3年以上深度學習或大模型項目經驗
- 有醫(yī)療AI、或其他領域成功落地經驗,并全程參與
3. 技術要求:
- 精通主流開源模型架構及其核心組件,深入理解不同模型的優(yōu)缺點及適用場景
- 具備在多節(jié)點多卡環(huán)境下進行大模型訓練及調優(yōu)實戰(zhàn)經驗,熟練使用相關工具鏈
- 精通至少一種主流微調框架和推理框架,深度理解框架源碼
- 熟練掌握Python編程,熟悉深度學習庫、科學計算庫及相關工具包
- 掌握Docker、Kubernetes等DevOps工具
4. 我們深知精通全部AI領域工程細節(jié)是不現(xiàn)實的,但如果您對以下某幾個方面達到頂尖水平,將機有競爭力:
- 需要您具有各個開源大模型的逆向解析能力,充分了解權重歸因,并具備知識定位經驗及故障診斷經驗
- 需要您具備精準的算力資源規(guī)劃能力,對硬件計算極限、網(wǎng)絡通信帶寬瓶頸算有著充分的認知和優(yōu)化策略
- 需要您對訓練數(shù)據(jù)的籌備有豐富的經驗,能夠協(xié)同數(shù)據(jù)團隊籌備由淺至深、分布均勻領域數(shù)據(jù),并構建并泛化特定任務的高質量訓練數(shù)據(jù)
- 需要您對推理過程有豐富的優(yōu)化經驗,具備平衡`精度 - 成本 - 響應延遲`三角關系的能力
加分項目:
- 有強化學習項目經驗,能根據(jù)業(yè)務場景設計獎勵函數(shù)及策略
- 對中醫(yī)有一定程度的了解,有中醫(yī)臨床經驗,或在中醫(yī)醫(yī)療機構中具有工作經驗會優(yōu)先錄取