国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 7月3日

大模型強化學(xué)習(xí)算法專家

5-8萬
  • 北京朝陽區(qū)
  • 5-10年
  • 碩士
  • 全職
  • 招1人

職位描述

強化學(xué)習(xí)?大模型算法
崗位職責(zé)
1. 研發(fā)和優(yōu)化大模型強化學(xué)習(xí)核心算法(RLHF、RFT、ReFT、DPO、KTO、IPO、RRHF等),專注于專業(yè)研報撰寫和思維鏈優(yōu)化方向
2. 構(gòu)建端到端強化學(xué)習(xí)訓(xùn)練管道,包括高效獎勵模型設(shè)計、策略優(yōu)化算法研發(fā)和智能數(shù)據(jù)收集系統(tǒng)開發(fā)
3. 深度探索思維鏈(Chain-of-Thought)強化學(xué)習(xí)范式,提升模型在邏輯推理、分析論證和專業(yè)內(nèi)容生成上的能力
4. 研發(fā)專業(yè)研報領(lǐng)域的對齊技術(shù),提高模型輸出的專業(yè)性、準確性和可靠性
5. 設(shè)計并實現(xiàn)多輪推理優(yōu)化算法,提升模型在復(fù)雜分析和長文檔撰寫中的連貫性和深度
6. 跟蹤大模型強化學(xué)習(xí)前沿技術(shù),撰寫高質(zhì)量技術(shù)分析報告,為團隊提供深度技術(shù)指導(dǎo)
任職要求
1. 計算機科學(xué)、機器學(xué)習(xí)或人工智能相關(guān)專業(yè)碩士及以上學(xué)歷
2. 具備豐富的RLHF對齊策略實踐經(jīng)驗,能獨立設(shè)計和優(yōu)化人類偏好建模系統(tǒng)
3. 熟悉并實踐過最新的強化學(xué)習(xí)算法,如Constitutional AI、思維鏈增強型RL訓(xùn)練和無強化學(xué)習(xí)的偏好優(yōu)化方法
4. 對專業(yè)研報結(jié)構(gòu)化生成和思維鏈(Chain-of-Thought)技術(shù)有深入研究
5. 參與過大規(guī)模開放領(lǐng)域大模型訓(xùn)練項目(如ChatGPT、Gemini、Claude類RL訓(xùn)練方法論實踐)
6. 對強化學(xué)習(xí)理論體系有深入理解,并能熟練應(yīng)用于大模型訓(xùn)練和優(yōu)化
7. 扎實的數(shù)學(xué)基礎(chǔ)(統(tǒng)計學(xué)、優(yōu)化理論、信息論等),能獨立解讀頂會論文(NeurIPS/ICLR/ICML)并高效實現(xiàn)
加分項
1. 有經(jīng)濟、科技、工業(yè)等專業(yè)領(lǐng)域研究報告撰寫或分析經(jīng)驗
2. 熟悉ReAct、Tree-of-Thought等思維鏈增強技術(shù)的算法實現(xiàn)
3. 在文檔結(jié)構(gòu)化生成、專業(yè)知識對齊或邏輯推理能力優(yōu)化方面有研究成果
4. 對專業(yè)研報質(zhì)量評估體系有研究,能構(gòu)建有效的評估指標和獎勵函數(shù)
5. 熟悉大型語言模型在專業(yè)內(nèi)容生成中的常見挑戰(zhàn)和解決方案
6. 發(fā)表過相關(guān)領(lǐng)域高質(zhì)量研究論文
7. 開源項目貢獻經(jīng)驗
8. 良好的跨團隊協(xié)作能力和技術(shù)溝通能力

工作地點

北京朝陽區(qū)榮聯(lián)科技大廈6

職位發(fā)布者

劉女士/HR

昨日活躍
立即溝通
公司Logo萬聯(lián)易達物流科技有限公司
萬聯(lián)易達集團深入融入社會產(chǎn)業(yè)鏈各業(yè)務(wù)場景,基于AI和通用技術(shù),構(gòu)建以人工智能研究應(yīng)用平臺、大宗商品交易平臺、整車物流服務(wù)平臺、數(shù)智金融平臺為核心的智能化產(chǎn)業(yè)生態(tài)系統(tǒng),為各類產(chǎn)業(yè)生態(tài)伙伴提供智能、高效、安全的數(shù)智化解決方案,讓產(chǎn)業(yè)生態(tài)更智能,推動社會產(chǎn)業(yè)運行效率提升。人工智能研究應(yīng)用平臺萬聯(lián)易達人工智能研究應(yīng)用平臺連接各業(yè)務(wù)平臺和產(chǎn)業(yè)生態(tài)合作伙伴,通過具體的業(yè)務(wù)場景驅(qū)動,研究開發(fā)上千個人工智能垂類大模型智能體,賦能各業(yè)務(wù)場景,支撐產(chǎn)業(yè)生態(tài)智能、高效、安全運行。商品交易平臺聚合黑色金屬、有色金屬、能源化工品和農(nóng)副產(chǎn)品的上游、中游及部分下游產(chǎn)品的展銷和招采,以人工智能技術(shù)輔助買賣雙方形成最優(yōu)購銷方案,大幅降低交易成本。整車物流服務(wù)平臺5A級網(wǎng)絡(luò)貨運平臺。以“智慧場站”為紐帶,利用人工智能和大數(shù)據(jù)技術(shù),形成端到端全鏈路、線上線下共融合的數(shù)智化整車貨運解決方案,同時提供整車貨運交易撮合服務(wù)和承運交付服務(wù)?!爸腔蹐稣尽被贏IoT、大數(shù)據(jù)等先進技術(shù)和各類資源,串聯(lián)包括訂單管理、場區(qū)內(nèi)裝卸貨、在途運輸在內(nèi)的物流管理智能化平臺,有效實現(xiàn)人、車、貨、場之間的智聯(lián)互通,為監(jiān)管部門、企業(yè)構(gòu)建智能化管理和調(diào)度體系攻克服務(wù)最后障礙,打通最后一環(huán)。數(shù)智金融平臺連通大宗商品交易和整車物流服務(wù)業(yè)務(wù)場景,提供信貸融資、保險、車輛融資租賃、期貨風(fēng)險管理和投資服務(wù),利用人工智能技術(shù)極大提高業(yè)務(wù)效率和識別風(fēng)控能力。
公司主頁