【崗位職責(zé)】
1.負(fù)責(zé) Lustre、NVMe 等存儲協(xié)議/系統(tǒng)與公司高速互聯(lián)網(wǎng)絡(luò)的適配方案設(shè)計、開發(fā)與調(diào)試,確保存儲與網(wǎng)絡(luò)的高效協(xié)同,重點(diǎn)突破GPU Direct存儲場景下的性能瓶頸。
2.深度集成 NVIDIA GPU Direct Storage(GDS)和國產(chǎn)卡同類技術(shù),開發(fā)公司高速互聯(lián)網(wǎng)絡(luò)與 GDS 的對接層,實現(xiàn)從遠(yuǎn)端存儲到 GPU 顯存的直接數(shù)據(jù)傳輸。
3.針對存儲-高速網(wǎng)交互過程中的帶寬、延遲等關(guān)鍵指標(biāo)開展專項優(yōu)化,提升存儲數(shù)據(jù)讀寫效率。
4.完成存儲高速網(wǎng)適配功能的集成驗證與性能測試,定位并解決適配過程中的兼容性與穩(wěn)定性問題,確保方案在智算和HPC場景下的可靠運(yùn)行。
5.撰寫存儲高速網(wǎng)適配技術(shù)文檔、優(yōu)化報告,協(xié)同團(tuán)隊推進(jìn)適配成果的產(chǎn)品化落地。
【崗位能力要求】
1.研究生及以上學(xué)歷,計算機(jī)科學(xué)與技術(shù)、網(wǎng)絡(luò)工程、存儲工程等相關(guān)專業(yè),2-4年存儲系統(tǒng)適配、高速網(wǎng)絡(luò)相關(guān)工作經(jīng)驗。
2.精通Lustre、NVMe等至少一種主流存儲協(xié)議/系統(tǒng)的原理與架構(gòu),具備豐富的存儲與網(wǎng)絡(luò)適配實操經(jīng)驗。
3.深入理解 NVIDIA GPUDirect 系列技術(shù),尤其是 GPUDirect Storage(GDS),有實際項目經(jīng)驗者優(yōu)先。
4.熟悉高速互聯(lián)網(wǎng)絡(luò)技術(shù)(如IB、以太網(wǎng)高速互聯(lián))、RDMA及NVME-oF等核心協(xié)議,具備扎實的網(wǎng)絡(luò)編程與存儲開發(fā)基礎(chǔ),熟悉SPDK或內(nèi)核NVMe驅(qū)動者優(yōu)先。
5.熟悉Linux操作系統(tǒng),掌握存儲與網(wǎng)絡(luò)性能調(diào)優(yōu)工具的使用,能夠獨(dú)立搭建適配測試環(huán)境并排查復(fù)雜技術(shù)問題。
6.具備較強(qiáng)的邏輯思維能力、問題解決能力與團(tuán)隊協(xié)作精神,有存儲高速網(wǎng)適配項目經(jīng)驗者優(yōu)先。
7.能力突出者,提供管理崗位和待遇。