1 主要職責(zé)
1)跟蹤全球大模型前沿技術(shù)動(dòng)態(tài),負(fù)責(zé)大模型應(yīng)用架構(gòu)設(shè)計(jì)、預(yù)訓(xùn)練/微調(diào)、性能調(diào)優(yōu)及工程化部署;攻克模型開(kāi)發(fā)中的技術(shù)難點(diǎn),持續(xù)提升模型在精度、推理效率、可解釋性等核心指標(biāo)上的表現(xiàn)。
2)針對(duì)具體業(yè)務(wù)場(chǎng)景,完成大模型技術(shù)的環(huán)境適配、接口改造與方案落地;解決AI技術(shù)在業(yè)務(wù)落地過(guò)程中遇到的兼容性、性能瓶頸、穩(wěn)定性等工程問(wèn)題。
3)主導(dǎo)大模型服務(wù)系統(tǒng)的性能優(yōu)化,包括推理加速、資源調(diào)度優(yōu)化、高可用架構(gòu)迭代等,確保系統(tǒng)在高并發(fā)、大規(guī)模業(yè)務(wù)場(chǎng)景下的穩(wěn)定性與可靠性。
4)緊密聯(lián)動(dòng)產(chǎn)品、算法、工程等團(tuán)隊(duì),參與需求拆解、方案評(píng)審與項(xiàng)目落地全流程,高效推動(dòng)AI項(xiàng)目從原型到生產(chǎn)環(huán)境的交付。
5)完成領(lǐng)導(dǎo)交辦的其他與大模型技術(shù)研發(fā)、工程化相關(guān)的工作任務(wù)。
2 崗位要求
1)學(xué)歷專業(yè):本科及以上學(xué)歷,人工智能、智能建造、計(jì)算機(jī)、軟件、自動(dòng)化等相關(guān)專業(yè);
2)經(jīng)驗(yàn)要求:2年以上人工智能研發(fā)崗位相關(guān)經(jīng)驗(yàn),擁有工程設(shè)計(jì)行業(yè)人工智能研發(fā)經(jīng)驗(yàn)者優(yōu)先;
3)熟練掌握Python語(yǔ)言及相關(guān)開(kāi)發(fā)工具,如:pytorch、langchain、fastapi。
4)有RAG和LLM應(yīng)用開(kāi)發(fā)經(jīng)驗(yàn),熟悉RAG開(kāi)發(fā)流程,熟悉提示詞工程,熟悉MCP協(xié)議。
5)熟悉訓(xùn)練和優(yōu)化大語(yǔ)言模型(LLM),如qwen,GLM,DeepSeek等,具備自主學(xué)習(xí)和解決問(wèn)題的能力。
6)熟悉使用模型分部署部署與主流模型推理框架VLLM、SGLang、LMDeploy中的一種。
7)熟練掌握SQL數(shù)據(jù)庫(kù)、NoSQL數(shù)據(jù)庫(kù)、向量數(shù)據(jù)庫(kù)等的使用,包括但不限于,如MySQL、ElasticSearch、Milvus等。
8)熟悉Linux操作系統(tǒng),能夠熟練運(yùn)用Linux shell和docker。
9)熟練借助現(xiàn)有大模型快速完成開(kāi)發(fā)。
10)具有創(chuàng)新意識(shí),較強(qiáng)的溝通表達(dá)和協(xié)調(diào)能力。
11)以下情況優(yōu)先:
A:熟悉國(guó)產(chǎn)化AI環(huán)境并由實(shí)際經(jīng)驗(yàn)者優(yōu)先(npu,dcu);
B:有語(yǔ)音與圖像相關(guān)算法經(jīng)驗(yàn)者;
C:具有agent工程落地經(jīng)驗(yàn)者;