一、工作職責(zé)
1. 模型開發(fā)與優(yōu)化
(1)負責(zé)大模型全鏈路開發(fā),包括數(shù)據(jù)清洗、特征工程、偏好對齊(RLHF)及大小模型國產(chǎn)化加速卡部署。
(2)設(shè)計并實施多維度模型評估方案(如準確性、推理速度、資源效率),定位并解決模型性能瓶頸。
(3)探索前沿技術(shù)(如長上下文、MoE 架構(gòu)優(yōu)化、多智能體協(xié)作),推動模型在推理速度及場景適配性上的突破。
2. 工程化部署與落地
(1)開發(fā)文件解析程序,支持多格式數(shù)據(jù)(如文本、圖像、表格)的標準化處理與適配,確保數(shù)據(jù)高效輸入模型。
(2)基于國產(chǎn)加速卡(如昇騰910B、寒武紀MLU等)部署大模型,優(yōu)化模型壓縮、量化及推理加速(如顯存動態(tài)卸載、訓(xùn)推共卡協(xié)同技術(shù))。
(3)開發(fā)模型推理接口(如RESTful API、gRPC),并完成與前后端系統(tǒng)的聯(lián)調(diào),確保低延遲、高并發(fā)場景下的穩(wěn)定運行。
3. 技術(shù)協(xié)作與產(chǎn)品落地
(1)與產(chǎn)品、工程團隊協(xié)作,將大模型能力轉(zhuǎn)化為實際產(chǎn)品(如智能交互、數(shù)據(jù)分析工具),解決行業(yè)痛點并提升業(yè)務(wù)效率。
(2)參與工業(yè)級大模型平臺開發(fā),支持私有化部署及行業(yè)定制化需求(如SFT、強化學(xué)習(xí)優(yōu)化)。
(3)編寫技術(shù)文檔,推動技術(shù)方案在團隊內(nèi)的高效傳遞與落地。
二、任職要求
1. 技術(shù)能力要求
(1)深度學(xué)習(xí)框架與工具:
?精通PyTorch、TensorFlow等主流框架。熟悉Hugging Face、LangChain、ollama等工具。
(2)工程化能力:
? Python編程能力優(yōu)秀;熟練使用Docker、Kubernetes實現(xiàn)模型容器化部署。
?具備模型壓縮、量化及國產(chǎn)加速卡(如昇騰、寒武紀)部署經(jīng)驗,顯存優(yōu)化技術(shù)者優(yōu)先。
?熟練開發(fā)RESTful API、gRPC等接口,具備前后端聯(lián)調(diào)經(jīng)驗及微服務(wù)架構(gòu)設(shè)計能力。
?具備基于開源大模型問答系統(tǒng)工程化開發(fā)經(jīng)驗
(3)大模型核心技術(shù):
?具備大nlp模態(tài)模型、Agent智能體系統(tǒng)開發(fā)經(jīng)驗者優(yōu)先。
2. 算法與理論基礎(chǔ)
(1)扎實的數(shù)學(xué)基礎(chǔ)(線性代數(shù)、概率統(tǒng)計、優(yōu)化理論),熟悉生成式模型(如GPT、BERT)原理及Scaling Law、Long Context等前沿方向。
(2)熟悉梯度消失、過擬合等問題的解決方案,能快速將頂會論文轉(zhuǎn)化為工程實踐。
3. 項目與經(jīng)驗要求
(1)參與過nlp大模型模態(tài)Agent系統(tǒng)開發(fā)或工業(yè)級大模型部署項目。
(2)具備文件解析程序開發(fā)、國產(chǎn)加速卡部署(如昇騰910B集群)及接口開發(fā)經(jīng)驗者優(yōu)先。
4. 軟技能與素質(zhì)
(1)良好的跨團隊協(xié)作能力,能高效溝通技術(shù)方案與業(yè)務(wù)需求,推動項目進展。
(2)具備技術(shù)文檔撰寫、代碼規(guī)范及開源社區(qū)貢獻經(jīng)驗者優(yōu)先。