一、崗位職責(zé)
1. 基于Spring Cloud+Spring AI技術(shù)棧,負(fù)責(zé)智能平臺(tái)后端開發(fā),主導(dǎo)核心模塊設(shè)計(jì)、編碼與測(cè)試,實(shí)現(xiàn)AI能力與業(yè)務(wù)系統(tǒng)集成。
2. 研發(fā)智能調(diào)度管理系統(tǒng),整合YARN框架,實(shí)現(xiàn)服務(wù)器、智算資源與智能算法的算力調(diào)度、任務(wù)分發(fā)及資源匹配。
3. 優(yōu)化微服務(wù)架構(gòu),解決高并發(fā)問(wèn)題,提升系統(tǒng)吞吐量與穩(wěn)定性;設(shè)計(jì)優(yōu)化調(diào)度算法,實(shí)現(xiàn)算力動(dòng)態(tài)分配、彈性擴(kuò)縮容。
4. 監(jiān)控資源狀態(tài),排查調(diào)度沖突與系統(tǒng)故障,保障系統(tǒng)7×24小時(shí)穩(wěn)定運(yùn)行;優(yōu)化系統(tǒng)性能,降低調(diào)度延遲。
5. 與跨團(tuán)隊(duì)協(xié)作完成接口聯(lián)調(diào),編寫技術(shù)文檔,跟蹤前沿技術(shù)并推動(dòng)落地。
二、任職要求
(一)基礎(chǔ)條件
1. 本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),3-5年后端開發(fā)經(jīng)驗(yàn),1年以上智能調(diào)度系統(tǒng)開發(fā)經(jīng)驗(yàn)。
2. 具備良好的問(wèn)題解決能力、協(xié)作能力與自主學(xué)習(xí)能力,編碼規(guī)范,熟悉Git、Maven工具。
(二)核心技術(shù)能力
1. 精通Java/Python,熟練掌握Spring Cloud、Spring Boot、Spring AI等框架,了解大數(shù)據(jù)知識(shí)。
2. 熟悉算力調(diào)度邏輯,精通YARN框架,有資源協(xié)同調(diào)度及彈性擴(kuò)縮容項(xiàng)目經(jīng)驗(yàn)優(yōu)先。
3. 熟練使用MySQL等數(shù)據(jù)庫(kù)及Redis、RabbitMQ/Kafka中間件,能解決分布式、高并發(fā)問(wèn)題。
4. 理解分布式系統(tǒng)設(shè)計(jì)原則,熟悉Docker,了解K8s及CI/CD流程者優(yōu)先。
(三)加分項(xiàng)
1. 有智算中心、AI平臺(tái)、算力調(diào)度云平臺(tái)開發(fā)經(jīng)驗(yàn),熟悉GPU調(diào)度、YARN運(yùn)維者優(yōu)先。
2. 具備調(diào)度算法工程化實(shí)現(xiàn)、彈性擴(kuò)縮容策略落地經(jīng)驗(yàn)者優(yōu)先。
3. 熟悉Linux、Shell腳本,有AI模型訓(xùn)推平臺(tái)、大模型算力調(diào)度經(jīng)驗(yàn)者優(yōu)先。