【職位描述】
作為我們AI團隊的核心算法成員,您將專注于大型語言模型(LLM)的微調、優(yōu)化與應用落地,以及部分私有小模型的算法優(yōu)化,主要是在礦業(yè)地質應用方面的私有模型。您的工作核心是提升模型在礦業(yè)、地質領域和特定場景下的理解、生成和推理能力,并主導構建新一代檢索增強生成(RAG)系統(tǒng)的算法策略。您將與一流的Java后端工程師并肩作戰(zhàn),將最前沿的算法研究成果轉化為穩(wěn)定、高效、可擴展的線上服務,為我們的產品提供強大的AI內核。
【主要職責】
1. 大模型微調與優(yōu)化:負責領域大模型的微調(Fine-Tuning)工作,包括但不限于全參數微調、LoRA、QLoRA、P-Tuning等高效微調技術,持續(xù)提升模型在特定任務上的表現。
2. 私有小模型的實現與優(yōu)化:負責私有小模型的算法實現和優(yōu)化工作,主要是礦業(yè)和地質方向的小模型。
3. RAG算法研究與實現:深入研究并構建先進的RAG(檢索增強生成)系統(tǒng),優(yōu)化包括文本分割(Chunking)、向量化(Embedding)、檢索排序(Re-ranking)、提示工程(Prompt Engineering) 在內的全鏈路算法效果。
4. 數據體系建設:構建和管理高質量的指令微調數據集、評估數據集和知識庫數據,設計數據自動化處理與標注方案,持續(xù)通過數據驅動算法效果提升。
5. 模型評估與迭代:建立科學的模型評估體系,設計離線與在線評估方案,監(jiān)控模型線上表現,基于用戶反饋和數據洞察持續(xù)迭代優(yōu)化模型和算法策略。
6. 技術探索與創(chuàng)新:跟蹤學術界與工業(yè)界最新進展(如Agent、多模態(tài)等),并將有潛力的技術應用于實際業(yè)務場景,進行概念驗證(POC)和落地實踐。
7. 緊密跨團隊協(xié)作:與后端開發(fā)團隊深度合作,確保算法模型的高效部署和線上服務;與產品經理溝通,將業(yè)務需求轉化為技術方案。
【職位要求】
必備條件:
1. 教育背景:計算機科學、人工智能、數學、統(tǒng)計學等相關專業(yè),碩士及以上學歷(特別優(yōu)秀者可放寬至本科)。
2. 算法基礎:扎實的機器學習/深度學習基礎,熟悉常見的NLP模型(如Transformer, BERT, GPT系列等)和理論。
3. 大模型經驗:對大型語言模型(如LLaMA, ChatGLM, GPT等)有深入理解,具備至少一種大模型的實際微調經驗(項目或研究經歷)。
4. 編程與工具:熟練掌握Python及主流的深度學習框架(如PyTorch, TensorFlow)。熟悉LangChain、LlamaIndex等應用框架者優(yōu)先。
5. 數據處理能力:具備優(yōu)秀的數據處理和分析能力,熟練使用Pandas, NumPy等工具,能夠從復雜數據中發(fā)現問題并得出結論。
6. 解決問題能力:具備強大的邏輯思維能力和創(chuàng)造性解決問題的能力,能夠獨立開展實驗,并對結果進行深入分析。
7. 團隊與溝通:良好的團隊合作精神和溝通能力,能夠清晰地向工程團隊解釋算法原理和需求。
優(yōu)先考慮:
1. RAG實戰(zhàn)經驗:有完整的RAG項目經驗,深入參與過檢索器、生成模塊的優(yōu)化,或對相關組件(如向量數據庫)有調優(yōu)經驗。
2. 高級技術經驗:有模型量化(Quantization)、推理加速、Agent應用、多模態(tài)大模型等相關經驗者優(yōu)先。
3. 開源貢獻或論文:在頂級會議(ACL, EMNLP, NeurIPS, ICML等)發(fā)表過相關論文,或有影響力的開源項目貢獻者優(yōu)先。
4. 工程落地能力:具備一定的工程思維,了解Web服務、API設計、Docker等基本概念,能與開發(fā)團隊順暢協(xié)作。
5. 領域知識:在礦業(yè)、地質領域有相關經驗。
【我們提供】
?世界級的挑戰(zhàn):直面全球最前沿的AIGC技術難題,您的算法工作將是產品的核心競爭力。
?頂尖的團隊:與領域內的專家和充滿激情的伙伴共事,享受純粹的技術氛圍和高效的協(xié)作環(huán)境。
?成長與影響:提供廣闊的學術和技術成長空間,您的成果將直接影響和改變一個行業(yè)的運作模式。
?全面薪酬福利:具有競爭力的薪資方案、完善的福利保障體系及靈活的工作方式。