崗位職責(zé):
1、AI服務(wù)開發(fā)與優(yōu)化:基于開源知識(shí)庫、Agent框架進(jìn)行開發(fā),優(yōu)化大模型應(yīng)用性能及功能擴(kuò)展。構(gòu)建大模型服務(wù)化(MaaS),提供模型推理、微調(diào)、Prompt工程等核心能力,支持企業(yè)級業(yè)務(wù)場景接入。設(shè)計(jì)高可用、低延遲的分布式服務(wù)架構(gòu),解決模型部署、資源調(diào)度、負(fù)載均衡等工程問題;
2、算法與模型開發(fā):參與LLM(大語言模型)訓(xùn)練、微調(diào)及優(yōu)化,結(jié)合業(yè)務(wù)需求改進(jìn)模型效果(如指令遵循、長文本理解、多模態(tài)推理)。開發(fā)核心算法模塊,如RAG(檢索增強(qiáng)生成)、Agent任務(wù)編排、多模型協(xié)同推理等;3、解決方案撰寫:根據(jù)不同業(yè)務(wù)場景和客戶需求,結(jié)合公司數(shù)字化基礎(chǔ),制定可落地的解決方案;
4、系統(tǒng)維護(hù)與協(xié)作:監(jiān)控并保障MaaS服務(wù)的穩(wěn)定性,優(yōu)化GPU資源利用率及服務(wù)成本。協(xié)同算法團(tuán)隊(duì)完成模型工程化落地,與產(chǎn)品團(tuán)隊(duì)協(xié)作定義技術(shù)方案,確保需求高效交付。
任職要求:
1、本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、軟件工程、數(shù)學(xué)等相關(guān)專業(yè)優(yōu)先;
2、5年以上AI開發(fā)相關(guān)領(lǐng)域的工作經(jīng)驗(yàn),具備AI服務(wù)開發(fā)、模型優(yōu)化和大規(guī)模數(shù)據(jù)處理的實(shí)際經(jīng)驗(yàn);
3、熟練掌握至少一種主流編程語言(如Go、Python),具備高并發(fā)和高性能系統(tǒng)開發(fā)經(jīng)驗(yàn),能夠針對項(xiàng)目需求做出性能優(yōu)化;
4、扎實(shí)的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)基礎(chǔ),熟悉PyTorch、TensorFlow等框架,掌握大模型微調(diào)技術(shù)(如LoRA、P-Tuning)。熟悉大規(guī)模AI模型開發(fā)及優(yōu)化,包括LLM、GPT系列、BERT等深度學(xué)習(xí)模型。具備這些模型在實(shí)際項(xiàng)目中的應(yīng)用經(jīng)驗(yàn),能夠針對不同任務(wù)選擇合適的模型架構(gòu);
5、熟悉大模型應(yīng)用開發(fā)全流程,包括數(shù)據(jù)處理、模型部署(vLLM、Triton)、Prompt工程、模型測評體系建設(shè);
6、熟悉容器化技術(shù)(Docker)及容器編排工具(Kubernetes),有在分布式系統(tǒng)中進(jìn)行AI服務(wù)部署的經(jīng)驗(yàn),能夠通過容器化技術(shù)進(jìn)行資源調(diào)配與管理,提高系統(tǒng)穩(wěn)定性和性能;
7、項(xiàng)目經(jīng)驗(yàn)有大型AI系統(tǒng)(如智能客服、知識(shí)庫問答、Agent工作流)開發(fā)經(jīng)驗(yàn)者優(yōu)先。參與過開源項(xiàng)目貢獻(xiàn),或主導(dǎo)過高并發(fā)、高可用服務(wù)架構(gòu)設(shè)計(jì)者優(yōu)先;
8、熟悉LangChain、LlamaIndex等框架,或具備開源社區(qū)貢獻(xiàn)經(jīng)歷;
9、優(yōu)秀的邏輯思維能力與問題解決能力,對技術(shù)落地有強(qiáng)烈責(zé)任心。良好的團(tuán)隊(duì)協(xié)作與溝通能力,能快速理解業(yè)務(wù)需求并輸出技術(shù)方案。具備良好的英語讀寫能力,能夠閱讀并理解英文技術(shù)文檔。