崗位名稱:大模型場(chǎng)景開(kāi)發(fā)工程師
崗位職責(zé):
1.負(fù)責(zé)大語(yǔ)言模型(LLM)的本地化部署、性能優(yōu)化及推理加速,熟練使用Xinference、Ollama、vLLM等框架進(jìn)行模型服務(wù)化;確保模型在生產(chǎn)環(huán)境中的穩(wěn)定運(yùn)行和高性能表現(xiàn)。
2.基于LangChain、Dify等框架開(kāi)發(fā)大模型應(yīng)用,設(shè)計(jì)并實(shí)現(xiàn)復(fù)雜工作流編排與Function Calling應(yīng)用;
3.負(fù)責(zé)知識(shí)庫(kù)的構(gòu)建及優(yōu)化任務(wù)。
任職要求:有金融行業(yè)工作經(jīng)驗(yàn),
1.計(jì)算機(jī)科學(xué)/人工智能相關(guān)專業(yè)本科及以上學(xué)歷;
2.精通Python語(yǔ)言,熟悉使用FastAPI、Flask、Django任一框架;
3.熟悉Linux開(kāi)發(fā)環(huán)境,熟練使用Git等協(xié)作工具。
4.2年以上NLP算法開(kāi)發(fā)應(yīng)用經(jīng)驗(yàn),熟悉Transformer、BERT、GPT等模型原理及調(diào)優(yōu)方法;
5.熟悉大模型部署工具鏈(Xinference/Ollama/vLLM),有實(shí)際部署通義千問(wèn)、DeepSeek等模型經(jīng)驗(yàn)。
6.熟悉LangChain/Dify等應(yīng)用框架,具備工作流編排與Function Calling開(kāi)發(fā)經(jīng)驗(yàn);
7.熟練使用Docker實(shí)現(xiàn)模型服務(wù)容器化,了解CI/CD流程及K8s生態(tài);
8.加分項(xiàng):具有數(shù)據(jù)開(kāi)發(fā)相關(guān)經(jīng)驗(yàn),熟悉數(shù)據(jù)開(kāi)發(fā)任務(wù),包括但不限于報(bào)表生成、ETL流程的調(diào)度和優(yōu)化; & #40;2& #41;在LLM應(yīng)用創(chuàng)新(RAG/Agent)方向有落地案例。