崗位職責(zé): 1. 企業(yè)級(jí)AI中臺(tái)架構(gòu)設(shè)計(jì) a) 主導(dǎo)AI能力中臺(tái)核心模塊研發(fā)(含數(shù)據(jù)治理、模型管理、服務(wù)編排、資源調(diào)度),設(shè)計(jì)標(biāo)準(zhǔn)化AI能力接口(REST/gRPC) b) 構(gòu)建服務(wù)化組件(如特征計(jì)算引擎、統(tǒng)一監(jiān)控告警平臺(tái)),支持業(yè)務(wù)部門快速?gòu)?fù)用AI基礎(chǔ)能力 2. SDK/API服務(wù)體系建設(shè) a) 設(shè)計(jì)開發(fā)者友好的SDK工具鏈(含多語(yǔ)言支持、安全鑒權(quán)、Mock測(cè)試環(huán)境) b) 主導(dǎo)API網(wǎng)關(guān)架構(gòu)升級(jí),實(shí)現(xiàn)服務(wù)限流熔斷、灰度發(fā)布、調(diào)用鏈追蹤一體化 c) 開發(fā)自動(dòng)化API文檔生成與版本兼容性檢測(cè)工具 3. 全棧效能提升 a) 搭建模型即服務(wù)(MaaS)平臺(tái),實(shí)現(xiàn)從模型訓(xùn)練到API發(fā)布的自動(dòng)化流水線 b) 構(gòu)建企業(yè)內(nèi)部AI資產(chǎn)中心(含預(yù)訓(xùn)練模型庫(kù)、數(shù)據(jù)集管理、Prompt模板市場(chǎng)) 4. 企業(yè)級(jí)支持系統(tǒng) a) 設(shè)計(jì)分布式調(diào)試工具鏈,支持跨部門協(xié)作問題定位(如日志血緣追蹤、GPU資源爭(zhēng)用分析) b) 開發(fā)SDK兼容性驗(yàn)證套件(適配Windows/Linux多版本、ARM/X86架構(gòu)) 任職要求: 1.本科以上學(xué)歷,5年以上AI架構(gòu)設(shè)計(jì)經(jīng)驗(yàn); 2.負(fù)責(zé)過完整參與過2個(gè)以上AI中臺(tái)架構(gòu)建設(shè)(必須包含數(shù)據(jù)/模型/服務(wù)管理至少兩大子系統(tǒng));深度掌握微服務(wù)治理框架(Spring Cloud/Dubbo,需提供設(shè)計(jì)方案示例);實(shí)現(xiàn)過日均調(diào)用量>10萬(wàn)次的API服務(wù)集群調(diào)優(yōu) 3.具備SDK/API開發(fā)能力:主導(dǎo)過企業(yè)級(jí)SDK開發(fā)(包含自動(dòng)更新/埋點(diǎn)上報(bào)等機(jī)制),精通OpenAPI規(guī)范,具備API網(wǎng)關(guān)二次開發(fā)經(jīng)驗(yàn),完成過API調(diào)用成功率>99.99%的服務(wù)保障方案設(shè)計(jì),有兼容 OpenAI API 接口標(biāo)準(zhǔn)的 API 開發(fā)經(jīng)驗(yàn) 4. 核心技術(shù)棧: a) Kubernetes+Docker生態(tài)、Protobuf/gRPC協(xié)議棧、ELK日志體系 b) 前端:React/Vue+數(shù)據(jù)可視化(ECharts/D3),Headless 組件開發(fā) c) 后端:Go/Python高并發(fā)服務(wù)開發(fā),熟悉Celery/RabbitMQ異步任務(wù)調(diào)度 d) AI框架:PyTorch/TensorFlow模型優(yōu)化,主流推理服務(wù)部署框架 5. 行業(yè)適配性要求 a) 具有企業(yè)私有化部署支持經(jīng)驗(yàn)(需提供鯤鵬/飛騰平臺(tái)兼容性驗(yàn)證報(bào)告) b) 熟悉IDC機(jī)房與云原生混合部署模式的基礎(chǔ)設(shè)施差異 c) 曾推動(dòng)過中臺(tái)能力在至少3個(gè)業(yè)務(wù)部門的規(guī)?;瘧?yīng)用