崗位職責:
1.設計、構建與優(yōu)化符合公司策略的云平臺架構與解決方案,確保應用系統(tǒng)的高可用性、彈性伸縮能力、卓越性能、安全保障及成本效益;
2.負責公司私有云及外部主流公有云(如阿里云、Azure)平臺的管理、部署和日常運維;
3.負責基于Rancher的Kubernetes(K8S)平臺的核心技術管理,包括集群生命周期管理(部署、升級、擴縮容)、安全策略實施、監(jiān)控告警優(yōu)化、日常運維及故障排除;
4.負責制定并持續(xù)完善公司云平臺管理策略,推動其落地實施,并建立效果評估與反饋機制。
崗位任職要求:
1.本科及以上學歷,計算機科學與技術/軟件工程/信息與計算科學等相關專業(yè);
2.熟悉云原生應用架構,精通容器編排技術,熟練掌握Rancher等Kubernetes集群管理工具,熟悉服務網格(如Istio)。持有CKA認證者優(yōu)先;
3.精通阿里云、Azure云等主流公有云平臺管理(IaaS/PaaS核心服務)。持有阿里云ACP、微軟相關云認證者優(yōu)先;
4.熟悉GPU資源的規(guī)劃、調度、監(jiān)控和優(yōu)化。具備大語言模型(LLM)等AI工作負載相關基礎設施的管理經驗者優(yōu)先;
5.熟練掌握Java/Python/Go中至少一門主流編程語言,具備良好的自動化腳本編寫或平臺工具開發(fā)能力。具有開發(fā)Operator、CRD控制器或云原生相關工具,或具有Terraform等自動化開發(fā)經驗者優(yōu)先;
6.熟悉Kafka、RabbitMQ等消息中間件的原理與應用;
7.了解主流大數據處理與數據集成組件(如HDFS, Spark, Flink, FlinkCDC, Debezium等)的架構與工作原理者優(yōu)先;
8.掌握操作系統(tǒng)(Linux為主)、計算機網絡(TCP/IP協(xié)議棧、路由交換基礎、防火墻)、分布式系統(tǒng)基礎及容器技術等核心計算機理論知識;
9.具備大學英語六級(CET-6)或以上水平,具備優(yōu)秀的英文技術文檔閱讀和編寫能力;
10.具備優(yōu)秀的溝通協(xié)調能力和團隊合作精神。