工作職責(zé):
1.負(fù)責(zé)公司核心算力平臺(tái)(包括但不限于GPU/CPU集群管理、調(diào)度系統(tǒng)、分布式存儲(chǔ)、高性能網(wǎng)絡(luò))的規(guī)劃、設(shè)計(jì)與開發(fā)工作。
2.主導(dǎo)關(guān)鍵技術(shù)攻關(guān),解決平臺(tái)在性能、穩(wěn)定性、安全性及成本效益方面面臨的挑戰(zhàn)。進(jìn)行架構(gòu)評(píng)審和技術(shù)選型,確保技術(shù)方案的先進(jìn)性與可行性。
3.主導(dǎo)從概念到上線的完整產(chǎn)品生命周期管理,協(xié)調(diào)研發(fā)、設(shè)計(jì)、運(yùn)營等團(tuán)隊(duì),確保產(chǎn)品成功交付。
4.負(fù)責(zé)產(chǎn)品的定價(jià)策略、上市推廣及后續(xù)的迭代優(yōu)化,對產(chǎn)品的用戶增長、收入及利潤率負(fù)責(zé)。
5.深入市場與客戶,洞察行業(yè)趨勢,挖掘基于算力、網(wǎng)絡(luò)、云計(jì)算等技術(shù)的產(chǎn)品機(jī)會(huì)。
6.定義產(chǎn)品愿景、路線圖,并撰寫詳盡的商業(yè)需求文檔(BRD)和產(chǎn)品需求文檔(PRD)。
7.跟蹤業(yè)界前沿技術(shù)(如Slurm/Kubernetes在算力調(diào)度中的應(yīng)用RoCE/InfiniBand網(wǎng)絡(luò)),并推動(dòng)其在團(tuán)隊(duì)內(nèi)的落地。
8.負(fù)責(zé)開發(fā)團(tuán)隊(duì)成員的績效管理,激發(fā)團(tuán)隊(duì)潛能,建立優(yōu)秀的技術(shù)和產(chǎn)品文化,制定團(tuán)隊(duì)工作流程和規(guī)范。
任職要求:
1.計(jì)算機(jī)科學(xué)、軟件工程或相關(guān)專業(yè)本科及以上學(xué)歷。8年以上互聯(lián)網(wǎng)、云計(jì)算或基礎(chǔ)設(shè)施領(lǐng)域的技術(shù)開發(fā)經(jīng)驗(yàn),其中至少2年以上擔(dān)任技術(shù)經(jīng)理或產(chǎn)品負(fù)責(zé)人角色,并有過成功帶領(lǐng)5人以上團(tuán)隊(duì)的經(jīng)驗(yàn)。
2.精通至少一門主流編程語言(如Go, Python, Java, C++),具備扎實(shí)的編碼能力和良好的代碼品位。
3.深厚的系統(tǒng)架構(gòu)功底,對分布式系統(tǒng)、高并發(fā)、高可用性架構(gòu)有深刻理解和實(shí)戰(zhàn)經(jīng)驗(yàn)。
4.熟悉算力相關(guān)技術(shù)棧,包括但不限于:容器化(Docker)、編排調(diào)度(Kubernetes)、集群管理、GPU虛擬化、分布式存儲(chǔ)、Linux操作系統(tǒng)。
5.熟悉網(wǎng)絡(luò)與云技術(shù),深入了解TCP/IP、SDN、VPC、云計(jì)算(公有/私有/混合云)服務(wù)與架構(gòu)。
6.具備強(qiáng)烈的產(chǎn)品思維和用戶視角,能夠?qū)⒓夹g(shù)能力轉(zhuǎn)化為清晰的客戶價(jià)值。
7.有獨(dú)立負(fù)責(zé)過至少一款技術(shù)產(chǎn)品從0到1的全過程經(jīng)驗(yàn),并取得可驗(yàn)證的市場成果。
8.卓越的溝通協(xié)調(diào)能力,能夠有效聯(lián)動(dòng)技術(shù)、業(yè)務(wù)、銷售等多個(gè)部門。
9.強(qiáng)大的自驅(qū)力、責(zé)任心和抗壓能力,熱愛挑戰(zhàn),追求卓越。