服務(wù)職責(zé)
1. 需求分析與系統(tǒng)設(shè)計 深度挖掘 SRE 運維場景需求(如自動化修復(fù)、容量規(guī)劃、混沌工程),輸出業(yè)務(wù)流程圖與痛點分析報告。 設(shè)計可觀測性方案(日志/指標(biāo)/鏈路追蹤),主導(dǎo)埋點實施與數(shù)據(jù)看板開發(fā)(Python/Shell 腳本實現(xiàn))。
2. 技術(shù)方案設(shè)計與交付 輸出 SRE 技術(shù)解決方案文檔(PRD/MRD),含交互邏輯設(shè)計(Axure/Visio)及自動化架構(gòu)圖(XMind)。 編寫 Java/Python/Shell 自動化腳本原型(如故障自愈、資源調(diào)度),確保與開發(fā)團(tuán)隊技術(shù)落地對齊。
3. 項目管理與跨團(tuán)隊協(xié)同 主導(dǎo) SRE 項目全周期管理(需求→交付),協(xié)調(diào)開發(fā)/測試/SRE 團(tuán)隊資源,把控進(jìn)度與風(fēng)險。 組織 故障復(fù)盤會議(Post-mortem),推動生成改進(jìn)措施并納入自動化體系(如通過 Python 實現(xiàn)規(guī)則引擎)。
4. 技術(shù)交付與運維支持 負(fù)責(zé)智網(wǎng) SRE 項目交付,包括: 編寫 Ansible/Shell 自動化部署腳本; 基于 Python 開發(fā)監(jiān)控告警聯(lián)動工具(如對接 **********+企業(yè)微信); 優(yōu)化 Java 應(yīng)用性能(GC 調(diào)優(yōu)、線程池配置)。 提供生產(chǎn)環(huán)境重大故障的技術(shù)攻堅支持,主導(dǎo)根因分析(RCA)。
5. 數(shù)據(jù)驅(qū)動與持續(xù)優(yōu)化 通過運營數(shù)據(jù)分析(SQL/Python 數(shù)據(jù)處理)推動 SLO/SLA 提升,制定容量規(guī)劃策略。構(gòu)建自動化運維知識庫,沉淀 Shell/Python 工具鏈,降低重復(fù)性運維工作量。
任職要求 :
1. 知識技能
(1)學(xué)歷經(jīng)驗: 研究生2年/本科4年/???年以上技術(shù)項目經(jīng)驗,計算機、通信、自動化相關(guān)專業(yè)優(yōu)先。
(2)專業(yè)能力: 具備完整產(chǎn)品生命周期管理或大型技術(shù)項目交付經(jīng)驗(如SRE/DevOps/云平臺類項目)。 技術(shù)棧要求: 精通 Shell 腳本開發(fā)(自動化部署、日志分析、運維監(jiān)控)。 熟練掌握 Python(自動化工具開發(fā)、數(shù)據(jù)分析腳本、API集成); 有 TensorFlow/PyTorch 應(yīng)用經(jīng)驗優(yōu)先。 熟悉 Java 后端技術(shù)棧(Spring Boot 微服務(wù)架構(gòu)調(diào)試、JVM 性能優(yōu)化、日志分析)。 數(shù)據(jù)庫能力:熟練使用 MySQL(SQL 優(yōu)化、災(zāi)備方案設(shè)計)、了解 NoSQL 技術(shù)。 工具鏈:精通 Axure/XMind/Visio 輸出技術(shù)方案,熟練使用 Git/Jenkins/K8s 等 DevOps 工具。
(3)優(yōu)先項: 熟悉云平臺架構(gòu)(AWS/Azure/GCP)、監(jiān)控體系(**********/Grafana)及通信資源管理業(yè)務(wù)。
2. 綜合素質(zhì) 邏輯清晰,具備技術(shù)方案設(shè)計能力與用戶體驗優(yōu)化思維; 強大的跨部門協(xié)調(diào)能力,可獨立推動技術(shù)項目閉環(huán); 主動性問題解決意識,能識別系統(tǒng)瓶頸并提出工程優(yōu)化方案; 抗壓能力強,適應(yīng)敏捷迭代與7×24響應(yīng)支持。