崗位職責(zé):
1、AI服務(wù)開發(fā)與優(yōu)化:基于開源知識(shí)庫、Agent框架進(jìn)行二次開發(fā),優(yōu)化大模型應(yīng)用性能及功能擴(kuò)展。構(gòu)建大模型服務(wù)化(MaaS),提供模型推理、微調(diào)、Prompt工程等核心能力,支持企業(yè)級(jí)業(yè)務(wù)場(chǎng)景接入。設(shè)計(jì)高可用、低延遲的分布式服務(wù)架構(gòu),解決模型部署、資源調(diào)度、負(fù)載均衡等工程問題;
2、開源技術(shù)二次開發(fā):基于主流開源知識(shí)庫(如FAISS、Milvus)、Agent框架(如LangChain)、AI工具鏈進(jìn)行深度定制化開發(fā),滿足業(yè)務(wù)需求。優(yōu)化開源組件的性能瓶頸,解決高并發(fā)場(chǎng)景下的穩(wěn)定性問題;
3、算法與工程結(jié)合:針對(duì)業(yè)務(wù)場(chǎng)景優(yōu)化模型推理性能(如量化壓縮、動(dòng)態(tài)批處理),提升服務(wù)吞吐量。開發(fā)Prompt工程模板、RAG(檢索增強(qiáng)生成)流程,提升模型輸出質(zhì)量;
4、系統(tǒng)架構(gòu)設(shè)計(jì):設(shè)計(jì)可擴(kuò)展的云原生架構(gòu),集成Kubernetes/Docker實(shí)現(xiàn)自動(dòng)化部署與運(yùn)維,構(gòu)建監(jiān)控告警系統(tǒng),保障服務(wù)SLA指標(biāo) 。
任職要求:
1、本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、軟件工程、數(shù)學(xué)等相關(guān)專業(yè)優(yōu)先;
2、具有3年以上AI開發(fā)領(lǐng)域的工作經(jīng)驗(yàn),熟悉AI服務(wù)架構(gòu)、模型開發(fā)、優(yōu)化及部署等相關(guān)工作內(nèi)容;
3、編程能力:熟悉Python編程,有深度學(xué)習(xí)和NLP模型開發(fā)經(jīng)驗(yàn);熟練掌握TensorFlow、PyTorch等深度學(xué)習(xí)框架,并有實(shí)際應(yīng)用經(jīng)驗(yàn);
4、算法能力:熟練掌握Transformer/BERT/GPT等模型原理,熟悉模型部署與推理框架(如vllm、sglang等),有模型微調(diào)經(jīng)驗(yàn)(LoRA微調(diào)、指令微調(diào)等),熟悉常見機(jī)器學(xué)習(xí)算法(如聚類/分類/強(qiáng)化學(xué)習(xí));
5、系統(tǒng)能力:熟悉分布式系統(tǒng)設(shè)計(jì),精通gRPC/RESTful API開發(fā) 部署;
6、項(xiàng)目經(jīng)驗(yàn):2年以上大模型相關(guān)開發(fā)經(jīng)驗(yàn),主導(dǎo)過至少2個(gè)完整AI服務(wù)落地項(xiàng)目;
7、軟性要求:具備強(qiáng)烈的技術(shù)好奇心,能快速學(xué)習(xí)新興技術(shù),優(yōu)秀的邏輯思維能力和技術(shù)問題拆解能力,適應(yīng)敏捷開發(fā)流程,具備良好的跨團(tuán)隊(duì)協(xié)作意識(shí)。具備良好的英語讀寫能力,能夠閱讀并理解英文技術(shù)文檔。