崗位職責(zé):
1、負(fù)責(zé)多模態(tài)大模型(文本/圖像/視頻融合)的設(shè)計、開發(fā)與優(yōu)化;
2、研發(fā)多模態(tài)大模型(如CLIP、LLaVA、Flamingo等),提升跨模態(tài)理解與生成能力,包括圖像語義分析、邏輯推理等任務(wù)作;
3、參與大模型應(yīng)用開發(fā),與前后端團隊配合,將AI能力落地為實際可用的產(chǎn)品功能;
4、技術(shù)難題攻關(guān),解決團隊在產(chǎn)品研發(fā)過程中遇到的技術(shù)難題。
任職要求:
1、本科及以上學(xué)歷,計算機科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè),3年以上深度學(xué)習(xí)研發(fā)經(jīng)驗,1年以上大模型(10B+參數(shù))實戰(zhàn)經(jīng)驗;
2、精通PyTorch/TensorFlow框架,熟悉Megatron-LM、DeepSpeed等分布式訓(xùn)練工具;
3、深入理解Transformer、注意力機制、RLHF等核心技術(shù),具備模型源碼級調(diào)優(yōu)能力;
4、熟悉Hugging Face生態(tài),有LoRA、P-Tuning等高效微調(diào)技術(shù)經(jīng)驗;
5、熟練使用CUDA、TensorRT等加速庫,具備高性能計算優(yōu)化經(jīng)驗。