崗位職責:
1.負責大模型的應用開發(fā)、微調(diào)和優(yōu)化。
2.根據(jù)業(yè)務需求,設計和實現(xiàn)基于大模型的解決方案,如文本生成、對話系統(tǒng)、知識問答等。
3.開發(fā)基于大模型的知識庫構建、檢索增強生成系統(tǒng)及相關應用。
4.研究并探索大模型在不同業(yè)務場景中的創(chuàng)新性應用。
5.與產(chǎn)品、數(shù)據(jù)團隊協(xié)作,完成模型部署和效果評估
任職要求:
1.學歷要求:計算機科學、人工智能、數(shù)學、統(tǒng)計學等相關專業(yè)碩士及以上學歷。
2.工作經(jīng)驗:3年以上機器學習/深度學習相關經(jīng)驗,1年以上大模型應用或微調(diào)經(jīng)驗。
3.技術要求:
(1)熟悉深度學習框架(如PyTorch、TensorFlow),具備扎實的編程能力(Python為主);
(2)熟悉常見的大模型架構(如Transformer、GPT、BERT等),了解其原理和實現(xiàn)細節(jié);
(3)具備大模型微調(diào)經(jīng)驗,熟悉LoRA.P-Tuning、Adapter等微調(diào)技術;
(4)熟悉提示工程(Prompt Engineering)和少樣本學習(Few-shot Learning);
(5)熟悉大模型的推理優(yōu)化技術,如量化、剪枝、蒸餾等技術,能夠優(yōu)化模型性能并降低資源消耗。
(6)熟悉常見的NLP任務,如文本分類、命名實體識別、文本生成、對話系統(tǒng)等;
(9)熟練使用Java或Python開發(fā)服務端應用。