崗位要求:
1.熟練運維主流Linux操作系統(tǒng)如SUSE,RHEL和Ubunty,有系統(tǒng)運維經(jīng)驗
2.對 HPC 集群和高性能存儲有一定的了解,能基本操作數(shù)據(jù)中心以太網(wǎng)絡和 InfiniBand 網(wǎng)絡
3.熟悉基本的系統(tǒng)和集群監(jiān)控工具,如Zabbix和Grafana,有基本的腳本編寫能力
工作職責:
1.監(jiān)控數(shù)據(jù)處理平臺,及時處理告警,并定期對平臺進行巡檢。
2.負責平臺運行中的各種故障,必要時按照流程進行升級。按照客戶的流程執(zhí)行維護和變更