一、崗位職責
1、 掌握 AI 大模型、Agent 智能體、知識庫、向量數(shù)據(jù)庫、RAG 等技術,能夠根據(jù)業(yè)務需求設計和實現(xiàn)相關技術方案。
2、 具備基礎模型訓練、微調、推理部署與加速的應用開發(fā)能力,能夠將模型部署到線上并進行生產化優(yōu)化。
3、 針對具體業(yè)務需求,進行大模型繼續(xù)訓練(CT)、有監(jiān)督微調(SFT)、偏好學習及多模態(tài)模型訓練,優(yōu)化模型在特定場景下的表現(xiàn)。
4、 熟悉前沿的大模型應用技術與開源工具,如 DeepSeek、Llama、LangChain、Ilamalndex 等,具備實際操作經驗。
5、 制定并實施大模型的評估方案,結合人工與自動化評估手段,確保模型的性能可靠性和穩(wěn)定性。
6、有推薦系統(tǒng)、問答、搜索等實際項目的開發(fā)經驗,熟練掌握架構設計、特征工程和畫像體系建設,深入理解召回和排序算法,關注并研究行業(yè)前沿算法。
二、任職要求
1.相關專業(yè)本科以上學歷, 如計算機、軟件工程等;
2.熟練使用Python進行代碼開發(fā),熟悉LLM全流程的工作原理;
3.懂deepseek、有Baichuan、GLM、Qwen等熱門預訓練大語言模型框架經驗更佳, 熟練掌握相關技術原理;
4.熟悉Agent,Copilot的概念,了解目前LLM領域的前沿趨勢;
5.對大語言模型有著強烈的熱愛和興趣,并看好這個方向的發(fā)展。
三、工作區(qū)域:浙江杭州西湖區(qū)。
四、薪資待遇
20-30K