崗位職責(zé):
1、深入了解主流圖像和視頻模型,緊密結(jié)合C端用戶需求以及公司現(xiàn)有基礎(chǔ)設(shè)施,制定合理的模型部署方案;
2、搭建并維護(hù)適配圖像和視頻生成AI模型部署的服務(wù)器環(huán)境,實(shí)現(xiàn)模型在C端應(yīng)用中的快速部署與靈活遷移,大幅提升資源利用率,有效降低部署成本;
3、深度分析模型性能表現(xiàn),對模型實(shí)施針對性優(yōu)化與調(diào)優(yōu),顯著提高模型推理速度,優(yōu)化資源利用效率,熟悉各種并行策略,熟悉各種高效注意力機(jī)制、多GPU推理調(diào)度策略,優(yōu)化顯存碎片管理與計(jì)算資源利用率;
4、密切關(guān)注圖像和視頻生成AI模型部署領(lǐng)域的前沿技術(shù)發(fā)展趨勢,積極開展新技術(shù)、新方法的研究與探索,為公司C端應(yīng)用的模型部署工作引入創(chuàng)新思路與解決方案,提升產(chǎn)品競爭力。
崗位要求:
1、統(tǒng)招本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè)優(yōu)先,具備實(shí)際項(xiàng)目AI模型部署成功經(jīng)驗(yàn);
2、熟練掌握TensorFlow/Pytorch等至少一種深度學(xué)習(xí)框架,熟悉C++或Python編程語言;
3、熟悉各種并行策略,熟悉各種高效注意力機(jī)制、多GPU推理調(diào)度策略;
4、自驅(qū)力強(qiáng),有較高的技術(shù)追求,較好的團(tuán)隊(duì)協(xié)作意識。