崗位職責:
1.負責開發(fā)用于承載大模型的高效訓練、推理平臺,并結(jié)合特點進行算法與實現(xiàn)的優(yōu)化;
2.負責大模型(CV、NLP、多模態(tài)等方向)技術方案的實現(xiàn)和效果評估,跟進前沿AI大模型研究與效果性能調(diào)優(yōu);
3.推進分布式訓練中的計算和通信優(yōu)化,充分利用算力,使用大量加速卡探索性能邊界。
任職資格:
1.計算機相關專業(yè)碩士及以上學歷;
2.熟悉Linux開發(fā)環(huán)境,至少掌握Python、Java、C++等開發(fā)語言中的一種,熟悉Pytorch/TensorFlow/MindSpore/huggingface中的一種;
3.數(shù)學基礎扎實,熟悉深度學習與分布式算法,能夠清晰理解算法基本原理及實現(xiàn)方法,有大規(guī)模分布式算法相關開發(fā)經(jīng)驗者優(yōu)先;
4.有過深度學習平臺開發(fā)或大模型開發(fā)相關經(jīng)驗者優(yōu)先。