崗位職責(zé):
1.負責(zé)云平臺運營運維體系的整體規(guī)劃、建設(shè)與持續(xù)優(yōu)化,建立涵蓋云資源申請、審批、分配、使用監(jiān)控到回收的全生命周期閉環(huán)管理流程,提升資源利用率與管理規(guī)范性。
2. 設(shè)計并開發(fā)自動化運維工具與平臺功能模塊,實現(xiàn)部署、配置、巡檢、故障處理等場景的自動化,提升系統(tǒng)交付效率與穩(wěn)定性,降低運維人力成本。
3.構(gòu)建覆蓋基礎(chǔ)設(shè)施、中間件、應(yīng)用服務(wù)的全方位監(jiān)控與智能告警體系,集成指標(biāo)采集、日志分析、鏈路追蹤等能力,及時發(fā)現(xiàn)并響應(yīng)潛在風(fēng)險,保障云平臺高可用與業(yè)務(wù)連續(xù)性。
4. 深入調(diào)研內(nèi)部用戶需求與典型使用場景,收集反饋并推動產(chǎn)品功能優(yōu)化,持續(xù)提升平臺易用性、用戶體驗與用戶滿意度。
5. 與研發(fā)、安全、網(wǎng)絡(luò)、業(yè)務(wù)等部門高效協(xié)同,參與云平臺產(chǎn)品的需求評審、方案設(shè)計與迭代優(yōu)化,推動技術(shù)方案落地與規(guī)?;瘧?yīng)用。
任職要求:
核心是對云平臺有深入了解,有云平臺設(shè)計經(jīng)驗或云平臺運維運營經(jīng)驗
1.本科及以上學(xué)歷,計算機、軟件工程、網(wǎng)絡(luò)工程或相關(guān)專業(yè),3年以上云計算、運維開發(fā)或平臺運營相關(guān)工作經(jīng)驗。
2.熟悉主流公有云/私有云平臺(如阿里云、AWS、OpenStack、Kubernetes等)架構(gòu)與核心服務(wù),具備云資源管理與運營實踐經(jīng)驗。
3.熟練掌握至少一種腳本語言(Python/Shell/Go等),具備自動化工具開發(fā)能力,熟悉CI/CD、IaC(如Terraform、Ansible)者優(yōu)先。
4. 熟悉 Prometheus、Grafana、ELK、Zabbix 等監(jiān)控與日志分析工具,具備構(gòu)建大型系統(tǒng)監(jiān)控告警體系的經(jīng)驗。
5. 具備良好的邏輯思維與問題分析能力,對流程優(yōu)化與用戶體驗有敏銳洞察力。
6. 具備出色的溝通協(xié)調(diào)能力與跨團隊協(xié)作意識,能夠在復(fù)雜環(huán)境中推動項目落地。
7. 有ITSM工單系統(tǒng)(如Jira、ServiceNow)、成本管理(FinOps)或云管平臺(CMP)建設(shè)經(jīng)驗者優(yōu)先。
8. 熟悉DevOps理念與實踐,參與過云原生平臺建設(shè)者優(yōu)先。