工作職責(zé):
1、負(fù)責(zé)公司 AI 產(chǎn)品的穩(wěn)定性、可擴(kuò)展性和性能優(yōu)化;
2、管理和維護(hù)阿里云 / AWS 上的基礎(chǔ)設(shè)施與服務(wù),保證高可用與容災(zāi)能力;
3、參與 后端服務(wù)(Python / Node.js) 的運(yùn)維與性能調(diào)優(yōu),支持研發(fā)團(tuán)隊(duì)快速迭代;
4、維護(hù) Postgres 數(shù)據(jù)庫(kù)與 Weaviate 向量數(shù)據(jù)庫(kù),確保數(shù)據(jù)的可靠性與可擴(kuò)展性;
5、建立并優(yōu)化監(jiān)控、日志和告警體系(Prometheus / Grafana / ELK / OpenTelemetry 等),快速響應(yīng)線上問(wèn)題;
6、優(yōu)化 GitHub Actions CI/CD 流程,提升自動(dòng)化程度與交付效率;
7、與前端團(tuán)隊(duì)緊密協(xié)作,推動(dòng)全鏈路的可觀測(cè)性與性能優(yōu)化。
任職要求:
1、本科及以上學(xué)歷,計(jì)算機(jī)或相關(guān)專(zhuān)業(yè),2年以上相關(guān)經(jīng)驗(yàn)。
2、熟悉 Linux 系統(tǒng),精通至少一種腳本語(yǔ)言(Python / Go / Shell 等),熟悉React 技術(shù)棧;
3、有 云原生架構(gòu) 經(jīng)驗(yàn),熟悉 Docker、Kubernetes 的部署與運(yùn)維;
4、有 阿里云 / AWS 實(shí)際運(yùn)維經(jīng)驗(yàn),能獨(dú)立管理和優(yōu)化資源;
5、熟悉 Postgres 運(yùn)維與優(yōu)化,有數(shù)據(jù)庫(kù)高可用和備份容災(zāi)經(jīng)驗(yàn);
6、有 CI/CD 實(shí)踐經(jīng)驗(yàn),能獨(dú)立維護(hù)和優(yōu)化 GitHub Actions 工作流;
7、具備較強(qiáng)的故障排查能力和系統(tǒng)性思維,能在壓力下快速響應(yīng)問(wèn)題;
8、良好的團(tuán)隊(duì)溝通協(xié)作能力,愿意在快速迭代的環(huán)境中保障產(chǎn)品的穩(wěn)定上線。