一、職位描述
1.負責大模型訓練數(shù)據(jù)的構建,包括高質量數(shù)據(jù)生產、整理和清洗工作;
2.負責模型效果測評,對數(shù)據(jù)正確性提供判斷,對模型生成內容正確性提供判斷,對模型進行內容改進策略建議;
3.對大模型應用案例和數(shù)據(jù)進行分析,歸納關鍵性和普遍性問題,提高內容優(yōu)質率;
4.推動大模型應用方向數(shù)據(jù)標注工作,指導標注人員完成數(shù)據(jù)的高質量構建,保證按目標及質量要求完成結果產出;
5.對大模型的prompt撰寫有了解,并且能夠根據(jù)應用場景,進行prompt調優(yōu),驅動模型達到最優(yōu)效果。
二、職位要求
1.35歲以下,本科及以上學歷,計算機科學、數(shù)據(jù)科學或相關專業(yè),3年以上相關工作經歷;
2.計算機科學、數(shù)據(jù)科學或相關領域的本科及以上學歷。
3.熟練掌握至少一種編程語言,如Python,具備良好的編程實踐。
4.有NLP自然語言處理經驗者優(yōu)先;了解大模型數(shù)據(jù)要求、大模型訓練過程。
5.熟悉Data-Juicer等大模型數(shù)據(jù)治理開源框架。
6.了解機器學習和數(shù)據(jù)科學原理,有實際項目經驗。
7.良好的溝通能力和團隊合作精神,能夠與跨部門團隊緊密協(xié)作,推動項目進展。
8.具有快速學習和適應新技術的能力,能在動態(tài)環(huán)境中不斷優(yōu)化模型和算法。