職位描述
基礎研發(fā)平臺是美團的核心技術平臺,立足于“零售+科技”的戰(zhàn)略定位,通過打造人工智能、大數(shù)據(jù)、云計算、安全等核心技術能力,以及研發(fā)效能平臺、企業(yè)應用平臺等公共服務,為業(yè)務提供穩(wěn)定安全、擴展易用、技術領先的平臺技術和產品服務。
在這里,我們會參與到最前沿的技術研發(fā)和探索;能夠接觸超規(guī)模集群、海量數(shù)據(jù),挑戰(zhàn)高復雜業(yè)務場景,有機會與業(yè)界一流的工程師一起并肩前行。
在這里,我們有超強的技術氛圍,持續(xù)向社區(qū)貢獻業(yè)界實踐,加速行業(yè)技術發(fā)展;我們有完善的互聯(lián)網學習生態(tài)圈,重視底層邏輯和方法論,助力職業(yè)生涯的非線性成長。
真誠地邀請你,和我們一起驅動技術發(fā)展,創(chuàng)造行業(yè)價值。
崗位職責
1. 深入參與美團 GenAI 大規(guī)?;A設施建設
2. 負責美團大規(guī)?;P陀柧毧蚣芗軜嫷?,穩(wěn)定性、易用性、可運維能力和可觀測能力建設
3. 負責高達數(shù)萬卡規(guī)模和數(shù)萬億參數(shù)的大規(guī)模訓練性能優(yōu)化
崗位基本需求
1. 有扎實的計算機理論基礎,熟練掌握C++或Python語言
2. 熟悉CUDA或NPU編程經驗優(yōu)先,有RDMA實踐經驗優(yōu)先
3. 深入了解PyTorch 或 TensorFlow等引擎的架構和運行原理,有深度定制經驗優(yōu)先
4. 有Megatron-LM、DeepSpeed 等大模型訓練框架的優(yōu)化經驗優(yōu)先
5. 深入理解大模型訓練多維并行并行架構,如Tensor 并行、流水線并行、序列并行等
6. 深入理解Transformer 類模型結構,如BERT、GPT 、ViT等
7. 學習能力和好奇心強,具備良好的溝通協(xié)調能力與團隊協(xié)作精神
具備以下者優(yōu)先
1.有大模型相關算法研究經驗優(yōu)先,歡迎算法轉工程
2.有大規(guī)模分布式系統(tǒng)、高性能網絡研發(fā)、高性能計算相關經驗優(yōu)先
3.業(yè)界頭部規(guī)模的計算集群,海量數(shù)據(jù)和豐富的應用場景,挑戰(zhàn)與機遇并存。
崗位亮點
業(yè)界前列的算力規(guī)模、海量數(shù)據(jù)和豐富的應用場景,深入協(xié)同算法團隊深度參與大模型項目,共同探索Scaling Law 邊界。
查看全部