崗位職責(zé):
1、負(fù)責(zé)大模型的訓(xùn)練流程設(shè)計(jì)、微調(diào)策略優(yōu)化(SFT/DPO/ 增量預(yù)訓(xùn)練等)及推理效率提升,保障模型效果、穩(wěn)定性與落地性能。
2、主導(dǎo)大模型在 RAG與 Agent 領(lǐng)域的能力構(gòu)建,涵蓋數(shù)據(jù)體系設(shè)計(jì)、算法調(diào)優(yōu)、評(píng)估迭代全鏈路。
3、推動(dòng)大模型在具體業(yè)務(wù)場(chǎng)景的適配,完成 Prompt 工程、工具調(diào)用、多輪對(duì)話規(guī)劃等功能開(kāi)發(fā),結(jié)合 self-play/MCTS 等技術(shù)提升通用問(wèn)題解決能力。
4、與產(chǎn)品、工程團(tuán)隊(duì)協(xié)作,實(shí)現(xiàn) AI 功能的產(chǎn)品化落地,根據(jù)用戶反饋快速迭代模型。
5、跟蹤大模型領(lǐng)域(如多模態(tài)、長(zhǎng)上下文、邏輯推理)的前沿研究,探索新應(yīng)用方向,將創(chuàng)新技術(shù)融入產(chǎn)品。
6、完成上級(jí)安排的其他工作任務(wù)。
任職要求:
1、計(jì)算機(jī)科學(xué)、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷,碩士?jī)?yōu)先;
2、3 年以上大模型研發(fā)經(jīng)驗(yàn),精通主流模型(如 GPT、LLaMA、Qwen 等)的原理與微調(diào)技術(shù)(SFT/DPO/RLHF);
4、熟悉 RAG架構(gòu)、Agent 開(kāi)發(fā),掌握檢索/排序/意圖識(shí)別等技術(shù),熟練使用 LangChain、Llamalndex 等工具;
5、精通 Python 及深度學(xué)習(xí)框架(PyTorch/TensorFlow),具備高性能代碼實(shí)現(xiàn)與問(wèn)題調(diào)試能力;
6、良好的跨團(tuán)隊(duì)協(xié)作與溝通能力,能高效推動(dòng)技術(shù)落地;
7、對(duì) AI 技術(shù)有熱情,具備獨(dú)立研究與創(chuàng)新能力。