崗位職責(zé):
1. 大模型全鏈路開發(fā)與優(yōu)化:主導(dǎo)企業(yè)級大模型的設(shè)計、訓(xùn)練與迭代優(yōu)化,覆蓋文本生成、智能對話系統(tǒng)、代碼生成等核心應(yīng)用場景,打造高性能、高可用性的底層模型底座。
2. 行業(yè)化應(yīng)用落地構(gòu)建:基于成熟大模型技術(shù)棧,針對特定業(yè)務(wù)場景進(jìn)行應(yīng)用程序開發(fā)與適配,確保模型性能與實際業(yè)務(wù)需求深度匹配,實現(xiàn)技術(shù)到業(yè)務(wù)價值的高效轉(zhuǎn)化。
3. 定制化模型微調(diào)實施:結(jié)合企業(yè)個性化需求,設(shè)計科學(xué)的預(yù)訓(xùn)練模型微調(diào)方案,完成數(shù)據(jù)準(zhǔn)備、訓(xùn)練調(diào)參、效果驗證全流程,交付高度貼合業(yè)務(wù)場景的定制化解決方案。
4. 大規(guī)模數(shù)據(jù)體系搭建:設(shè)計并落地高效的大規(guī)模數(shù)據(jù)處理與清洗流程,構(gòu)建支持模型訓(xùn)練、評估與迭代的數(shù)據(jù)支撐體系,保障數(shù)據(jù)質(zhì)量與模型訓(xùn)練效率。
5. 前沿技術(shù)創(chuàng)新探索:跟蹤自然語言處理、大模型領(lǐng)域前沿算法與技術(shù)動態(tài),開展技術(shù)預(yù)研與創(chuàng)新實踐,持續(xù)優(yōu)化現(xiàn)有系統(tǒng)性能與效果,主導(dǎo)或參與核心技術(shù)突破項目。
6. 跨團(tuán)隊協(xié)同推進(jìn):與產(chǎn)品、工程、業(yè)務(wù)等多團(tuán)隊緊密協(xié)作,明確技術(shù)需求、同步項目進(jìn)度、解決跨領(lǐng)域問題,共同保障項目高效落地與業(yè)務(wù)目標(biāo)達(dá)成。
7. 技術(shù)知識沉淀與傳遞:撰寫規(guī)范、詳實的實驗報告、技術(shù)方案文檔及操作手冊,梳理技術(shù)經(jīng)驗與方法論,實現(xiàn)團(tuán)隊內(nèi)部知識的有效沉淀與傳遞。
任職資格:
1. 學(xué)歷背景:本科及以上學(xué)歷,具備扎實的學(xué)術(shù)基礎(chǔ)與學(xué)習(xí)能力。專業(yè)領(lǐng)域:計算機(jī)科學(xué)與技術(shù)、人工智能、應(yīng)用數(shù)學(xué)、數(shù)據(jù)科學(xué)等相關(guān)專業(yè)優(yōu)先。
2. 經(jīng)驗要求:擁有1年及以上自然語言處理(NLP)、機(jī)器學(xué)習(xí)或大模型相關(guān)領(lǐng)域開發(fā)經(jīng)驗;有大模型訓(xùn)練、微調(diào)或行業(yè)應(yīng)用落地經(jīng)驗者優(yōu)先。
3. 技術(shù)能力:熟練掌握Python編程語言,深入理解深度學(xué)習(xí)原理,能熟練運用TensorFlow、PyTorch等主流深度學(xué)習(xí)框架開展模型開發(fā)工作。
4. 模型認(rèn)知:對BERT、GPT、Qwen、LLaMA等主流大模型的架構(gòu)原理、訓(xùn)練邏輯與應(yīng)用場景有深入理解,具備實際項目中的模型選型、調(diào)優(yōu)與部署經(jīng)驗。
5. NLP技術(shù)儲備:熟悉文本分類、命名實體識別、機(jī)器翻譯、文本摘要、對話生成等常見NLP任務(wù)的技術(shù)原理與實現(xiàn)方案,能獨立設(shè)計并落地相關(guān)任務(wù)解決方案。
6. 數(shù)據(jù)能力:具備良好的數(shù)據(jù)分析思維與統(tǒng)計學(xué)基礎(chǔ),能熟練運用數(shù)據(jù)處理工具(如Pandas、Spark)處理、分析大規(guī)模數(shù)據(jù)集,具備數(shù)據(jù)驅(qū)動的問題解決能力。