亚洲第一网站男人都懂不卡,色妞欧美在线视频

登錄/注冊我要招人

400-885-9898

更新于 8月18日

APP

舉報

大模型算法工程師

1.5-2.5萬

武漢江漢區(qū)
1-3年
碩士
全職
招1人

職位描述

NLP

工作職責

(1) 負責對話與生成類模型的SFT（有監(jiān)督微調(diào)）與RLHF（基于人類反饋的強化學(xué)習）全流程：數(shù)據(jù)構(gòu)建→標注與質(zhì)檢→模型訓(xùn)練→離線/在線評測→上線迭代。

(2) 設(shè)計Prompt，并且利用爬蟲、模型生成等手段采集優(yōu)質(zhì)訓(xùn)練樣本，對模型進行SFT，提升模型效果。

(3) 設(shè)計與實現(xiàn)對齊訓(xùn)練鏈路：偏好數(shù)據(jù)采集與清洗、獎勵模型（RM）訓(xùn)練、策略優(yōu)化（PPO/DPO/GRPO 等），形成可復(fù)用的訓(xùn)練與評測流程。

(4) 面向真實業(yè)務(wù)進行生成效果優(yōu)化：提示工程、COT、拒答邊界、引用/事實核對、風格與長度控制，降低幻覺與違規(guī)率。

(5) 負責訓(xùn)練與部署工程化：多卡/多機并行（DeepSpeed）、混合精度（INT8/FP16/FP8）、vLLM推理加速與量化（LoRA/QLoRA）。

(6) 完成模型效果的評測：離線自動評測、人評流程與指南、線上 A/B；沉淀難例集與回歸集。

(7) 構(gòu)建數(shù)據(jù)閉環(huán)：從日志與用戶反饋挖掘難樣本與偏差案例，持續(xù)更新 SFT/偏好/對抗數(shù)據(jù)，迭代 RM 與策略。

(8) 與產(chǎn)品/后端/數(shù)據(jù)/安全合規(guī)協(xié)作，輸出技術(shù)方案與上線手冊，保障穩(wěn)定性、可觀測性與合規(guī)性。
任職資格
(1) 計算機/數(shù)學(xué)/統(tǒng)計等相關(guān)專業(yè)碩士及以上，1 年+ NLP/生成模型相關(guān)經(jīng)驗。

(2) 代碼與數(shù)理基礎(chǔ)扎實，熟練常見的機器學(xué)習算法，深度學(xué)習算法，理解 Transformer、優(yōu)化器、并行與顯存管理。

(3) 熟悉 SFT/RLHF 方法論與實現(xiàn)：數(shù)據(jù)對齊、RM 訓(xùn)練、PPO/DPO/GRPO 等策略優(yōu)化，能定位訓(xùn)練不穩(wěn)定與崩塌問題。

(4) 具備生成質(zhì)量優(yōu)化經(jīng)驗：提示策略、思維鏈/結(jié)構(gòu)化輸出、事實核對與幻覺治理、拒答與紅線規(guī)則。

(5) 有訓(xùn)練與推理工程化實踐：FSDP/ZeRO/DeepSpeed、LoRA/QLoRA、vLLM/TensorRT-LLM、監(jiān)控與日志。

(6) 良好的溝通協(xié)作與問題拆解能力，結(jié)果導(dǎo)向與自驅(qū)學(xué)習能力強。

工作地點

武漢江漢區(qū)發(fā)展四路微立方近零碳創(chuàng)新創(chuàng)業(yè)園2號樓3樓

完善一份簡歷
1736萬+企業(yè)在線搜索，780萬+海量職位精準推薦

相似職位

無人系統(tǒng)算法設(shè)計（AI及大數(shù)據(jù)方向）-東風越野車1.7-3萬
武漢 - 蔡甸
東風汽車
儲能產(chǎn)品控制算法工程師1.5-3萬
武漢 - 江夏
深圳市海思瑞科電氣技術(shù)有限公司
車聯(lián)網(wǎng)云平臺大數(shù)據(jù)算法工程師-02481.5-3萬
武漢 - 蔡甸
東風汽車
信號處理工程師1-2萬·13薪
武漢
武漢濱湖電子有限責任公司
算法工程師（高級）1.5-2.3萬
武漢 - 洪山
武漢博雅宏科技有限公司
圖像算法工程師（面試反饋快一輪面試統(tǒng)本）1.2-1.6萬
武漢 - 漢陽
深圳建廣數(shù)字科技有限公司青島分公司

查看更多相似職位

職位發(fā)布者

鄭女士/行政人事專員

今日活躍

立即溝通

博科國信（武漢）科技有限公司

武漢博科國泰信息技術(shù)有限公司（以下簡稱：博科國信），是為醫(yī)療行業(yè)提供信息與數(shù)字化解決方案的科技創(chuàng)新企業(yè)。運營總部中國武漢，外設(shè)重慶、北京、上海等公司，西安、南京、鄭州、長沙、成都、廣州等辦事處。旗下控股武漢博科醫(yī)療科技有限公司致力于智能醫(yī)療設(shè)備的研發(fā)和銷售，以及武漢博濟醫(yī)數(shù)技術(shù)有限公司專注于對大規(guī)模多源異構(gòu)?？漆t(yī)療數(shù)據(jù)進行深度處理和分析,助力慢病管理和創(chuàng)新新藥的開發(fā)。目前多家醫(yī)院和管理機構(gòu)選擇博科國信“集成平臺”、“數(shù)據(jù)中心”、“數(shù)據(jù)治理”、“HRP運營管理系統(tǒng)”、“耗材供應(yīng)鏈管理”、“醫(yī)衛(wèi)融合管理”、“VTE智能管理”等產(chǎn)品和“縣域數(shù)字醫(yī)共體”、“縣域智慧藥學(xué)數(shù)字服務(wù)”、“智慧醫(yī)院系統(tǒng)服務(wù)”等解決方案。今天的博科國信秉承“博采眾長、科技創(chuàng)新”的核心價值觀，獲得基蛋生物（上交所股票代碼：603387）、健麾信息（上交所股票代碼：605186）戰(zhàn)略投資。聯(lián)合華為、奇安信、中國電子等行業(yè)伙伴，提供更具創(chuàng)造性的產(chǎn)品和解決方案，持續(xù)支撐醫(yī)療機構(gòu)和政府部門的數(shù)據(jù)運營和科研分析能力。

公司主頁

關(guān)于我們: 公司介紹; 聯(lián)系我們; 誠聘英才

產(chǎn)品與服務(wù): 人才招聘; 企業(yè)招聘

使用與幫助: 賬號注銷; 意見反饋; 發(fā)票制度; 防騙指南; 法律協(xié)議; 資質(zhì)公示

智聯(lián)招聘更懂你的價值

智聯(lián)app小程序官方微信企業(yè)版APP

未經(jīng) Zhaopin.com 同意，不得轉(zhuǎn)載本網(wǎng)站之所有招聘信息及作品智聯(lián)招聘網(wǎng)版權(quán)所有

京ICP備17067871號?合字B2-20210134

京公網(wǎng)安備 11010502030147號?人力資源許可證:1101052003273號

網(wǎng)上有害信息舉報專區(qū)?違法不良信息舉報電話:400-885-9898 關(guān)愛未成年舉報熱線:400-885-9898-7

朝陽區(qū)人力資源與社會保障局監(jiān)督電話?

網(wǎng)絡(luò)110報警服務(wù)電子營業(yè)執(zhí)照