国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 1月6日

LLM 數(shù)據(jù)工程與微調(diào)研發(fā)實習生

150-210元/天
  • 上海徐匯區(qū)
  • 本科
  • 實習
  • 招1人
  • 6個月
  • 5天/周

職位描述

可轉(zhuǎn)正實習證明PYTHON/PANDASHF TRANSFORMERS計算機LLM計算機軟件云計算/大數(shù)據(jù)人工智能
一、核心職責
1. 訓練數(shù)據(jù)處理與生成:針對 LLM 訓練需求,清洗并規(guī)范化多源數(shù)據(jù)(文本 / 表格 / 日志),完成數(shù)據(jù)脫敏、去重、去噪,輸出符合訓練標準的語料;結(jié)合交通 / 政務(wù) / 停車等業(yè)務(wù)場景,設(shè)計提示詞模板與采樣策略(含 system prompt、shot 數(shù)量、temperature/top-p 參數(shù)),批量生成高質(zhì)量問答對與指令數(shù)據(jù),并搭建 “生成 - 過濾 - 審?!?閉環(huán)機制,保障數(shù)據(jù)質(zhì)量。
2. 微調(diào)數(shù)據(jù)流水線構(gòu)建:負責 LLM 微調(diào)數(shù)據(jù)全流程搭建,涵蓋數(shù)據(jù)切分、格式適配(Alpaca/ShareGPT 規(guī)范)、多輪質(zhì)檢與版本化管理,確保數(shù)據(jù)鏈路可追溯。
3. LLM 微調(diào)執(zhí)行與協(xié)助:執(zhí)行并協(xié)助團隊完成 LLM 參數(shù)高效微調(diào)任務(wù)(LoRA/QLoRA/PEFT),實時監(jiān)控訓練關(guān)鍵指標(loss、grad norm、VRAM 占用、TPS 等),輸出可復現(xiàn)的訓練腳本,配合團隊優(yōu)化微調(diào)效果。
4. 模型評測與驗收:開展 LLM 離線基準評測(Exact-Match、F1、ROUGE、BERTScore、長度懲罰等指標),針對交通 / 政務(wù) / 停車等領(lǐng)域數(shù)據(jù)集進行專項測試,對比基線模型與 A/B 測試結(jié)果,輸出評測報告。
5. 文檔與知識沉淀:梳理并沉淀崗位核心知識資產(chǎn),包括 LLM 訓練數(shù)據(jù)標準、提示詞庫、模型評測報告、模型迭代變更記錄(changelog),支撐團隊技術(shù)復用。
二、任職要求
1. 學歷與實習時長:計算機、數(shù)據(jù)科學、人工智能等相關(guān)專業(yè)在讀(本科及以上);每周可到崗≥3 天,連續(xù)實習≥3 個月,能穩(wěn)定參與項目迭代。
2. 基礎(chǔ)技術(shù)能力:熟練掌握 Python 編程(必備);具備正則表達式應(yīng)用、SQL 結(jié)構(gòu)化查詢能力;扎實掌握 Linux 操作系統(tǒng)基礎(chǔ)與 Git 版本控制(如分支管理、提交規(guī)范、沖突解決)。
3. 模型認知基礎(chǔ):熟悉 Transformer 模型核心原理(如 Tokenization、上下文窗口機制),理解 SFT(監(jiān)督微調(diào))、指令微調(diào)及模型對齊的核心邏輯,能清晰區(qū)分不同微調(diào)方式的適用場景。
4. 工作能力要求:具備快速試錯與迭代意識,能基于數(shù)據(jù)驗證提示詞優(yōu)化效果,以 “產(chǎn)出高質(zhì)量結(jié)果” 為導向,主動推進任務(wù)落地。
三、加分項
1. 微調(diào)與工具經(jīng)驗:了解 LoRA/QLoRA 等參數(shù)高效微調(diào)技術(shù),或使用過 DeepSpeed/Accelerate(訓練加速)、vLLM/TGI(推理部署)工具;有 HuggingFace Transformers、LlamaFactory 實操經(jīng)驗者優(yōu)先。
2. 評測能力儲備:使用過 lm-eval-harness、OpenAI Evals 等 LLM 專業(yè)評測框架,或有自建領(lǐng)域評測集(如交通 / 政務(wù)場景)、設(shè)計評測指標的經(jīng)驗。
3. 數(shù)據(jù)與開源經(jīng)驗:參與過數(shù)據(jù)標注、眾包質(zhì)檢、合成數(shù)據(jù)治理項目;曾向開源社區(qū)(如 HuggingFace、LlamaFactory)提交過 PR 并被合并者優(yōu)先。
四、技術(shù)棧(含應(yīng)用場景)
類別 核心技術(shù)及應(yīng)用說明
數(shù)據(jù)處理 Python/Pandas(數(shù)據(jù)清洗、分析與格式轉(zhuǎn)換)、SQL(結(jié)構(gòu)化數(shù)據(jù)查詢與提取)
模型訓練 HF Transformers/PEFT/TRL(LLM 基礎(chǔ)訓練框架)、LoRA/QLoRA(參數(shù)高效微調(diào))、DeepSpeed/Accelerate(訓練加速)、BitsAndBytes(低精度訓練)
服務(wù)與評測 vLLM/TGI(LLM 推理部署)、FastAPI(簡單服務(wù)搭建)、lm-eval-harness(評測框架)、Weights & Biases/Grafana(指標監(jiān)控與可視化)
協(xié)作與工具 Jupyter(數(shù)據(jù)探索與腳本調(diào)試)、VS Code(代碼開發(fā))、Git(版本控制與團隊協(xié)作)

工作地點

上海徐匯區(qū)阿里巴巴徐匯濱江園區(qū)X區(qū)-3棟4樓

認證資質(zhì)

營業(yè)執(zhí)照信息

職位發(fā)布者

章天一/HR

昨日活躍
立即溝通
公司Logo中城交(上海)科技有限公司
作為隧道股份孵化的上海首家國資背景垂類大模型企業(yè),中城交(上海)科技有限公司(簡稱“中城交”)聚焦交通與城市治理大模型領(lǐng)域,依托深厚的行業(yè)積淀、領(lǐng)先的技術(shù)優(yōu)勢與海量數(shù)據(jù)資產(chǎn),為城市智能化升級提供全鏈條解決方案。公司以“數(shù)據(jù)驅(qū)動決策,AI重塑城市”為使命,致力于成為全國領(lǐng)先的城市治理大模型構(gòu)建者。
公司主頁