一、崗位職責:
1. 負責大語言模型(LLM)在企業(yè)級AI產(chǎn)品中的算法設(shè)計、工程實現(xiàn)與落地優(yōu)化,包括但不限于智能問答、報告生成、指令理解、多輪對話、知識推理等場景;
2. 深入?yún)⑴c大模型算法選型、結(jié)構(gòu)改進、訓(xùn)練策略設(shè)計(如課程學(xué)習(xí)、對比學(xué)習(xí)、RLHF等),提升模型在垂直領(lǐng)域任務(wù)上的性能與魯棒性;
3. 設(shè)計并實現(xiàn)高效Prompt工程體系,包括模板構(gòu)建、動態(tài)Prompt生成、思維鏈(CoT)、自洽性校驗、輸出約束控制等,確保模型輸出可控、安全、符合業(yè)務(wù)語義;
4. 構(gòu)建和優(yōu)化RAG系統(tǒng)架構(gòu),從Embedding模型選型、檢索策略設(shè)計、上下文注入機制到生成結(jié)果融合,全鏈路提升知識問答準確率;
5. 主導(dǎo)或參與大模型微調(diào)項目(LoRA/QLoRA/Adapter/P-Tuning/全參微調(diào)),設(shè)計損失函數(shù)、采樣策略、評估指標,解決領(lǐng)域適配、災(zāi)難性遺忘、過擬合等問題;
6. 探索大模型壓縮、蒸餾、量化、緩存等算法優(yōu)化技術(shù),平衡模型性能與推理成本,適配邊緣或云端部署;
7. 與產(chǎn)品、算法、后端團隊協(xié)作,將算法能力封裝為穩(wěn)定API或模塊,支撐上層應(yīng)用快速迭代,并持續(xù)通過A/B測試、人工評估等方式驅(qū)動算法優(yōu)化;
8. 跟蹤大模型前沿技術(shù)(如MoE、Agent、Tool Learning、多模態(tài)LLM),評估其在安防/安控場景的可行性并推動技術(shù)預(yù)研與原型驗證。
二、任職要求:
1. 計算機、人工智能、機器學(xué)習(xí)、自動化等相關(guān)專業(yè),碩士及以上學(xué)歷,具有2年以上大模型/NLP/深度學(xué)習(xí)算法研發(fā)經(jīng)驗者優(yōu)先;
2. 深入理解Transformer架構(gòu)、注意力機制、位置編碼、KV Cache、RoPE等核心組件,能獨立推導(dǎo)前向/反向傳播過程;
3. 能針對業(yè)務(wù)問題抽象為算法任務(wù)(如分類、生成、排序、檢索),設(shè)計損失函數(shù)、評估指標、訓(xùn)練流程;
4. 精通Prompt Engineering,掌握高級技巧(Few-shot、Self-Ask、ReAct、AutoPrompt等),能設(shè)計動態(tài)、分層、帶約束的Prompt模板體系;
5. 有完整RAG項目經(jīng)驗,熟悉Embedding模型訓(xùn)練/選型(如BGE、E5、Contriever)、向量檢索優(yōu)化(ANN/HNSW)、重排序(Reranker)、上下文壓縮等關(guān)鍵技術(shù);
6. 有大模型微調(diào)實戰(zhàn)經(jīng)驗,熟悉參數(shù)高效微調(diào)方法(LoRA系列、Adapter、Prefix-Tuning),了解全參微調(diào)的數(shù)據(jù)構(gòu)建、學(xué)習(xí)率調(diào)度、梯度裁剪等訓(xùn)練技巧;
7. 熟練使用PyTorch + HuggingFace Transformers + DeepSpeed + vLLM 等工具鏈,具備模型訓(xùn)練、評估、部署全流程經(jīng)驗;
8. 熟悉LangChain / LlamaIndex / DSPy / Guidance / Transformers Agents 等大模型應(yīng)用框架,能快速構(gòu)建原型并工程化;
9. 有大模型應(yīng)用產(chǎn)品化經(jīng)驗者優(yōu)先。
三、福利待遇:雙休、五險一金、績效獎金、節(jié)日福利、項目激勵等