職位描述
崗位職責(zé):
1、負(fù)責(zé)端側(cè)模型推理框架開發(fā),包括模型壓縮、優(yōu)化技術(shù),在端側(cè)的接入、適配、算子開發(fā)工作,使之符合業(yè)務(wù)要求,提高性能收益;
2、負(fù)責(zé)探索和落地 AI 模型工程部署前沿技術(shù),包括但不限于稀疏計(jì)算、編譯優(yōu)化。
任職要求:
1、具備扎實(shí)的計(jì)算機(jī)科學(xué)功底和編程能力,了解常見并行計(jì)算算法,具有良好的編程習(xí)慣;
2、熟悉transformers、stable diffusion等主流模型原理;
3、良好的團(tuán)隊(duì)協(xié)作能力;
4、創(chuàng)新性強(qiáng),有良好的動(dòng)手實(shí)現(xiàn)能力,對(duì)技術(shù)有熱情;
5、加分項(xiàng):了解模型剪枝、量化等優(yōu)化方法原理,具備相關(guān)模型優(yōu)化經(jīng)驗(yàn)。