崗位要求:
1、 計(jì)算機(jī)科學(xué)或相關(guān)專(zhuān)業(yè)本科及以上學(xué)歷,3年以上運(yùn)維或運(yùn)維開(kāi)發(fā)經(jīng)驗(yàn)。
2、精通 Linux 操作系統(tǒng),能熟練進(jìn)行問(wèn)題診斷和性能調(diào)優(yōu)。
3、精通 Ansible 或其它自動(dòng)化配置管理工具,有大規(guī)模環(huán)境自動(dòng)化部署經(jīng)驗(yàn)。
4、 精通 Shell/Python 腳本編程。
5、深入理解網(wǎng)絡(luò)、存儲(chǔ)、負(fù)載均衡等基礎(chǔ)設(shè)施原理。
6、 具備良好的故障排查能力和抗壓能力
7、對(duì)GaussDB或GoldenDB的內(nèi)核機(jī)制有深入了解者。
優(yōu)先條件:
1、有從零開(kāi)始參與設(shè)計(jì)或開(kāi)發(fā)數(shù)據(jù)庫(kù)管理平臺(tái)、自動(dòng)化運(yùn)維平臺(tái)經(jīng)驗(yàn)者。
2、持有華為GaussDB或中興GoldenDB相關(guān)認(rèn)證者。
3、有大型金融、電信行業(yè)核心系統(tǒng)分布式數(shù)據(jù)庫(kù)運(yùn)維經(jīng)驗(yàn)者。
主要職責(zé)
1、負(fù)責(zé)GaussDB和GoldenDB分布式數(shù)據(jù)庫(kù)集群的部署、安裝、升級(jí)、擴(kuò)容、備份恢復(fù)、性能調(diào)優(yōu)和故障排除。
2、 分布式數(shù)據(jù)庫(kù)深度監(jiān)控與性能容量分析,設(shè)計(jì)并落實(shí)分布式數(shù)據(jù)自定義巡檢模板,定期/按需執(zhí)行數(shù)據(jù)庫(kù)健康巡檢。
3、 編寫(xiě)和維護(hù) Ansible Playbooks、Shell/Python 腳本,實(shí)現(xiàn)平臺(tái)下發(fā)的各類(lèi)運(yùn)維操作(如安裝、啟停、切換、檢查)。
4、 確保腳本的健壯性、冪等性和詳細(xì)的日志輸出,便于平臺(tái)跟蹤任務(wù)狀態(tài)。
5、開(kāi)發(fā)各類(lèi)檢查腳本(OS配置基線(xiàn)、數(shù)據(jù)庫(kù)參數(shù)一致性、高可用架構(gòu)靜態(tài)配置),并將結(jié)果標(biāo)準(zhǔn)化上報(bào)給平臺(tái)。
6、深入理解GoldenDB/GaussDB的架構(gòu)和運(yùn)維細(xì)節(jié),為平臺(tái)的功能設(shè)計(jì)提供專(zhuān)業(yè)建議。
7、當(dāng)平臺(tái)操作失敗時(shí),進(jìn)行深度根因分析,是腳本問(wèn)題、環(huán)境問(wèn)題還是數(shù)據(jù)庫(kù)本身問(wèn)題。
8、開(kāi)發(fā)或整合故障自愈(Self-Healing)方案,如數(shù)據(jù)庫(kù)異常后的自動(dòng)重啟與同步重建。
9、負(fù)責(zé)運(yùn)維腳本和平臺(tái)操作的權(quán)限控制、審計(jì)和合規(guī)性要求。