工作職責(zé):
1、負(fù)責(zé)系統(tǒng)、網(wǎng)絡(luò)和存儲資源的配置、監(jiān)控、維護(hù)和故障排除參與節(jié)假日值守。
2、監(jiān)控系統(tǒng)的性能與可用性,并依據(jù)監(jiān)控結(jié)果對系統(tǒng)配置進(jìn)行優(yōu)化。
3、實施系統(tǒng)備份,制定并定期更新災(zāi)難恢復(fù)預(yù)案,以確保數(shù)據(jù)的安全性。
4、協(xié)助部署與更新系統(tǒng)及應(yīng)用程序,涵蓋自動化腳本的編寫。
5、提供技術(shù)支持,解決用戶的問題和系統(tǒng)故障。
6、編寫和維護(hù)技術(shù)文檔和操作手冊。
7、與開發(fā)團(tuán)隊和實施團(tuán)隊緊密協(xié)作,推進(jìn)關(guān)鍵問題的解決,確保業(yè)務(wù)的快速迭代和穩(wěn)定運行。
8、配合客戶管理要求,完成日常賬號、安全、資源審計工作。
任職要求:
1、本科以上學(xué)歷;
2、5年以上相關(guān)工作經(jīng)驗;
3、精通Linux/Unix系統(tǒng)管理,能夠編寫自動化腳本,熟悉至少一種腳本語言(如Shell、Python)。
4、精通 Kubernetes (k8s) 和 Docker 相關(guān)技術(shù),能夠熟練進(jìn)行配置及問題排查處理。
5、精通監(jiān)控與告警工具,如Prometheus、Nagios和Zabbix,可以實現(xiàn)系統(tǒng)性能的自動化監(jiān)控,確保故障得到及時響應(yīng)并觸發(fā)相應(yīng)的告警。
6、熟悉國產(chǎn)化數(shù)據(jù)庫,例如移動的PanweiDB、華為的GaussDB以及阿里云的PolarDB,需要具備出色的問題解決和性能優(yōu)化能力。
7、精通國產(chǎn)操作系統(tǒng),如中標(biāo)麒麟、銀河麒麟、統(tǒng)信UOS、BC-Linux等,能夠針對各種系統(tǒng)環(huán)境執(zhí)行高效的性能優(yōu)化和故障排查。
8、精通安全防護(hù)工具的運用,能夠有效地部署安全措施,并且具有強烈的遵守安全規(guī)范的意識。
9、具備在云平臺上進(jìn)行操作、配置及優(yōu)化的能力。
10、具備出色的溝通技巧和團(tuán)隊協(xié)作精神,能在高壓環(huán)境下保持鎮(zhèn)定,準(zhǔn)確地分析和解決問題。
11、有中國移動項目運維經(jīng)驗優(yōu)先。
12、持有相關(guān)認(rèn)證,如RHCE、CCNA、CKA、ITIL Foundation。