注:此崗位是外包性質(zhì),在以易車工作。
崗位職責(zé):
1.主導(dǎo)業(yè)務(wù)穩(wěn)定性保障體系建設(shè),統(tǒng)籌風(fēng)險(xiǎn)識(shí)別、容量規(guī)劃、應(yīng)急預(yù)案制定與故障演練,牽頭解決生產(chǎn)環(huán)境雪崩、卡頓等穩(wěn)定性問(wèn)題。
2.負(fù)責(zé) CDN、LB4/LB7、Nginx、APISIX 等核心網(wǎng)關(guān)與流量調(diào)度組件的架構(gòu)設(shè)計(jì)、優(yōu)化調(diào)優(yōu)及運(yùn)維,保障流量分發(fā)高效可靠。
3.搭建全鏈路監(jiān)控體系,覆蓋基礎(chǔ)設(shè)施、網(wǎng)絡(luò)、應(yīng)用、接口等維度,實(shí)現(xiàn)異常秒級(jí)告警與快速定位。
4.運(yùn)用開(kāi)發(fā)能力編寫自動(dòng)化工具、腳本及平臺(tái)組件,提升穩(wěn)定性保障效率與自動(dòng)化水平。
5.負(fù)責(zé)百臺(tái)級(jí)服務(wù)器集群運(yùn)維(含資源調(diào)度、監(jiān)控排查、安全加固),保障集群穩(wěn)定高效。
6.參與萬(wàn)級(jí) QPS + 高并發(fā)業(yè)務(wù)架構(gòu)評(píng)審與容量評(píng)估,前置規(guī)避迭代風(fēng)險(xiǎn),推動(dòng)研發(fā) / 測(cè)試融入穩(wěn)定性規(guī)范。
7.主導(dǎo)重大故障復(fù)盤,沉淀根因與解決方案,輸出文檔及最佳實(shí)踐,持續(xù)優(yōu)化穩(wěn)定性體系。
8.深耕 Elasticsearch(ES)、消息隊(duì)列(MQ)、Redis 等核心中間件,負(fù)責(zé)其全生命周期運(yùn)維,含架構(gòu)設(shè)計(jì)、部署優(yōu)化、性能調(diào)優(yōu)及高可用集群搭建,牽頭解決緩存穿透、消息堆積、ES 集群分片異常等故障,沉淀運(yùn)維最佳實(shí)踐,提供穩(wěn)定高效的中間件支撐。
任職要求:
核心技能
1.扎實(shí)業(yè)務(wù)穩(wěn)定性保障經(jīng)驗(yàn),參與萬(wàn)級(jí) QPS + 業(yè)務(wù),有扛峰值、解復(fù)雜故障案例
2.精通 CDN 優(yōu)化,熟練 LB4/LB7、Nginx、APISIX 配置 / 調(diào)優(yōu) / 排查,可獨(dú)立解網(wǎng)關(guān)層問(wèn)題
3.熟練 1 門 + 開(kāi)發(fā)語(yǔ)言,有運(yùn)維工具 / 大型項(xiàng)目開(kāi)發(fā)經(jīng)驗(yàn),能代碼解決運(yùn)維問(wèn)題
4.百臺(tái)級(jí)服務(wù)器集群運(yùn)維經(jīng)驗(yàn),熟悉 Linux 底層與網(wǎng)絡(luò)原理,具備資源優(yōu)化、批量運(yùn)維能力
其他要求
1.本科及以上(計(jì)算機(jī)相關(guān)),5 年 + 互聯(lián)網(wǎng)運(yùn)維,3 年 + 穩(wěn)定性保障經(jīng)驗(yàn)
2.理解高并發(fā) / 高可用架構(gòu),熟悉微服務(wù) / 云原生穩(wěn)定性保障,能應(yīng)對(duì)分布式系統(tǒng)問(wèn)題
3.責(zé)任心強(qiáng)、有故障攻堅(jiān)意識(shí),速響應(yīng)緊急故障,抗壓,可夜間應(yīng)急
4.良好溝通協(xié)作能力,可跨團(tuán)隊(duì)推動(dòng)方案落地,善于沉淀分享
5.熟悉 Prometheus、JMeter 等監(jiān)控 / 壓測(cè)工具使用及定制
加分項(xiàng)
1.電商 / 直播 / 支付等峰值場(chǎng)景穩(wěn)定性保障經(jīng)驗(yàn)優(yōu)先
2.熟悉云原生(K8s / 容器),有云環(huán)境穩(wěn)定性保障經(jīng)驗(yàn)優(yōu)先
3.有 SRE 經(jīng)驗(yàn),熟悉 SLO/SLA/SLI 體系設(shè)計(jì)落地優(yōu)先
4.有安全攻防、應(yīng)對(duì)網(wǎng)絡(luò)攻擊經(jīng)驗(yàn)