任職要求
1.本科及以上學(xué)歷,計算機相關(guān)專業(yè),5年以上運維經(jīng)驗。
2.精通k8s離線私有化部署:具備企業(yè)級生產(chǎn)環(huán)境落地經(jīng)驗,熟悉網(wǎng)絡(luò)(CNI插件如Calico/Flannel)、存儲(CSI/持久卷方案)、高可用架構(gòu)(etcd集群、多Master)設(shè)計。
3.深入掌握生產(chǎn)運維全鏈路:包括日常巡檢、故障排查、性能優(yōu)化(資源調(diào)度/節(jié)點調(diào)優(yōu))、安全加固(RBAC/網(wǎng)絡(luò)策略/Pod安全策略)。
4.自動化開發(fā)能力:至少精通Shell/Python/Go中一種開發(fā)語言,能編寫高效運維腳本/工具實現(xiàn)自動化管理。
5.監(jiān)控體系實戰(zhàn)經(jīng)驗:精通Prometheus+Grafana+AlertManager的搭建與定制,熟悉Exporter開發(fā)、指標(biāo)采集、告警規(guī)則配置及可視化優(yōu)化。
6.熟悉Linux及中間件(Nginx/Redis/Kafka等)的運維與調(diào)優(yōu)。
7.熟悉主流數(shù)據(jù)庫如:MySQL/Oracle/PG/達夢數(shù)據(jù)庫,能夠進行數(shù)據(jù)庫高可用的安裝,熟悉數(shù)據(jù)庫運維工作。
8.具有良好的溝通能力、團隊協(xié)調(diào)能力、及文檔編寫能力。
9.熟悉生產(chǎn)應(yīng)用系統(tǒng)發(fā)布上線流程規(guī)范,熟悉ITIL體系及ITSM運維服務(wù)管理流程。
崗位職責(zé)
1.系統(tǒng)部署發(fā)布與配置管理?
?主導(dǎo)應(yīng)用從測試環(huán)境到生產(chǎn)環(huán)境的全流程部署,管理應(yīng)用配置參數(shù)和環(huán)境變量。
維護應(yīng)用版本控制與依賴管理。
制定發(fā)布方案及計劃、制定標(biāo)準(zhǔn)化發(fā)布流程、負(fù)責(zé)生產(chǎn)環(huán)境的應(yīng)用部署、版本發(fā)布及回退,負(fù)責(zé)配置管理、確保配置準(zhǔn)確性與一致性。
管理維護IT資源生命周期,及時同步更新CMDB。
2.自動化建設(shè)?
搭建開發(fā)運維工具鏈(CI/CD流水線)。
維護標(biāo)準(zhǔn)化自動部署工具(如Ansible/Puppet或類似功能商業(yè)軟件工具)。
3.穩(wěn)定性保障?
監(jiān)控系統(tǒng)健康狀態(tài),基礎(chǔ)監(jiān)控(CPU/內(nèi)存/磁盤)、應(yīng)用監(jiān)控(JVM/線程池)、業(yè)務(wù)監(jiān)控(業(yè)務(wù)系統(tǒng)關(guān)鍵指標(biāo)/數(shù)據(jù)分析)。
建立多級告警機制(Prometheus+Alertmanager+Grafana)。
執(zhí)行容量規(guī)劃與擴容操作。
?故障應(yīng)急響應(yīng)?,主導(dǎo)故障排查(日志分析→鏈路追蹤→根因定位),輸出故障分析處置報告。
4.安全運維?
制定變更方案及計劃,跟蹤變更結(jié)果,維護CMDB。
處理漏洞修復(fù)(CVE補丁或版本升級)。
管理訪問權(quán)限(RBAC模型、用戶管理)。
審計操作日志(滿足等保要求)。