LLM 數(shù)據(jù)工程與微調(diào)研發(fā)實習生

150-210元/天

上海徐匯區(qū)
本科
實習
招1人
6個月
5天/周

職位描述

可轉(zhuǎn)正實習證明PYTHON/PANDASHF TRANSFORMERS計算機LLM計算機軟件云計算/大數(shù)據(jù)人工智能

一、核心職責
1. 訓練數(shù)據(jù)處理與生成：針對 LLM 訓練需求，清洗并規(guī)范化多源數(shù)據(jù)（文本 / 表格 / 日志），完成數(shù)據(jù)脫敏、去重、去噪，輸出符合訓練標準的語料；結(jié)合交通 / 政務(wù) / 停車等業(yè)務(wù)場景，設(shè)計提示詞模板與采樣策略（含 system prompt、shot 數(shù)量、temperature/top-p 參數(shù)），批量生成高質(zhì)量問答對與指令數(shù)據(jù)，并搭建 “生成 - 過濾 - 審?！?閉環(huán)機制，保障數(shù)據(jù)質(zhì)量。
2. 微調(diào)數(shù)據(jù)流水線構(gòu)建：負責 LLM 微調(diào)數(shù)據(jù)全流程搭建，涵蓋數(shù)據(jù)切分、格式適配（Alpaca/ShareGPT 規(guī)范）、多輪質(zhì)檢與版本化管理，確保數(shù)據(jù)鏈路可追溯。
3. LLM 微調(diào)執(zhí)行與協(xié)助：執(zhí)行并協(xié)助團隊完成 LLM 參數(shù)高效微調(diào)任務(wù)（LoRA/QLoRA/PEFT），實時監(jiān)控訓練關(guān)鍵指標（loss、grad norm、VRAM 占用、TPS 等），輸出可復現(xiàn)的訓練腳本，配合團隊優(yōu)化微調(diào)效果。
4. 模型評測與驗收：開展 LLM 離線基準評測（Exact-Match、F1、ROUGE、BERTScore、長度懲罰等指標），針對交通 / 政務(wù) / 停車等領(lǐng)域數(shù)據(jù)集進行專項測試，對比基線模型與 A/B 測試結(jié)果，輸出評測報告。
5. 文檔與知識沉淀：梳理并沉淀崗位核心知識資產(chǎn)，包括 LLM 訓練數(shù)據(jù)標準、提示詞庫、模型評測報告、模型迭代變更記錄（changelog），支撐團隊技術(shù)復用。
二、任職要求
1. 學歷與實習時長：計算機、數(shù)據(jù)科學、人工智能等相關(guān)專業(yè)在讀（本科及以上）；每周可到崗≥3 天，連續(xù)實習≥3 個月，能穩(wěn)定參與項目迭代。
2. 基礎(chǔ)技術(shù)能力：熟練掌握 Python 編程（必備）；具備正則表達式應(yīng)用、SQL 結(jié)構(gòu)化查詢能力；扎實掌握 Linux 操作系統(tǒng)基礎(chǔ)與 Git 版本控制（如分支管理、提交規(guī)范、沖突解決）。
3. 模型認知基礎(chǔ)：熟悉 Transformer 模型核心原理（如 Tokenization、上下文窗口機制），理解 SFT（監(jiān)督微調(diào)）、指令微調(diào)及模型對齊的核心邏輯，能清晰區(qū)分不同微調(diào)方式的適用場景。
4. 工作能力要求：具備快速試錯與迭代意識，能基于數(shù)據(jù)驗證提示詞優(yōu)化效果，以 “產(chǎn)出高質(zhì)量結(jié)果” 為導向，主動推進任務(wù)落地。
三、加分項
1. 微調(diào)與工具經(jīng)驗：了解 LoRA/QLoRA 等參數(shù)高效微調(diào)技術(shù)，或使用過 DeepSpeed/Accelerate（訓練加速）、vLLM/TGI（推理部署）工具；有 HuggingFace Transformers、LlamaFactory 實操經(jīng)驗者優(yōu)先。
2. 評測能力儲備：使用過 lm-eval-harness、OpenAI Evals 等 LLM 專業(yè)評測框架，或有自建領(lǐng)域評測集（如交通 / 政務(wù)場景）、設(shè)計評測指標的經(jīng)驗。
3. 數(shù)據(jù)與開源經(jīng)驗：參與過數(shù)據(jù)標注、眾包質(zhì)檢、合成數(shù)據(jù)治理項目；曾向開源社區(qū)（如 HuggingFace、LlamaFactory）提交過 PR 并被合并者優(yōu)先。
四、技術(shù)棧（含應(yīng)用場景）
類別核心技術(shù)及應(yīng)用說明
數(shù)據(jù)處理 Python/Pandas（數(shù)據(jù)清洗、分析與格式轉(zhuǎn)換）、SQL（結(jié)構(gòu)化數(shù)據(jù)查詢與提取）
模型訓練 HF Transformers/PEFT/TRL（LLM 基礎(chǔ)訓練框架）、LoRA/QLoRA（參數(shù)高效微調(diào)）、DeepSpeed/Accelerate（訓練加速）、BitsAndBytes（低精度訓練）
服務(wù)與評測 vLLM/TGI（LLM 推理部署）、FastAPI（簡單服務(wù)搭建）、lm-eval-harness（評測框架）、Weights & Biases/Grafana（指標監(jiān)控與可視化）
協(xié)作與工具 Jupyter（數(shù)據(jù)探索與腳本調(diào)試）、VS Code（代碼開發(fā)）、Git（版本控制與團隊協(xié)作）

工作地點

上海徐匯區(qū)阿里巴巴徐匯濱江園區(qū)X區(qū)-3棟4樓

認證資質(zhì)

營業(yè)執(zhí)照信息

完善一份簡歷
1736萬+企業(yè)在線搜索，780萬+海量職位精準推薦

相似職位

AI開發(fā)助手8000-15000元
上海 - 閔行
匯像信息
NLP/CV/語音/深度學習/算法崗（接受應(yīng)屆+考研失?。?/a>1.8-3.5萬·16薪
上海 - 浦東
外企德科數(shù)字技術(shù)有限公司
上海ai-熟悉LLM+PYTHON-現(xiàn)場面試1.8-2萬
上海 - 靜安
信華信技術(shù)(昆山)有限公司
提示（Prompt）工程師2-3.5萬
上海 - 浦東
中船動力(集團)有限公司
AI知識庫助理工程師1.8-2.1萬
上海 - 奉賢
人本集團上海軸承有限公司
大模型技術(shù)支持（遷移/訓練/調(diào)優(yōu)）1.2-2萬·13薪
上海 - 青浦
外企德科數(shù)字技術(shù)有限公司

查看更多相似職位

職位發(fā)布者

章天一/HR

昨日活躍

立即溝通

中城交(上海)科技有限公司

作為隧道股份孵化的上海首家國資背景垂類大模型企業(yè)，中城交（上海）科技有限公司（簡稱“中城交”）聚焦交通與城市治理大模型領(lǐng)域，依托深厚的行業(yè)積淀、領(lǐng)先的技術(shù)優(yōu)勢與海量數(shù)據(jù)資產(chǎn)，為城市智能化升級提供全鏈條解決方案。公司以“數(shù)據(jù)驅(qū)動決策，AI重塑城市”為使命，致力于成為全國領(lǐng)先的城市治理大模型構(gòu)建者。

公司主頁

關(guān)于我們: 公司介紹; 聯(lián)系我們; 誠聘英才

產(chǎn)品與服務(wù): 人才招聘; 企業(yè)招聘

使用與幫助: 賬號注銷; 意見反饋; 發(fā)票制度; 防騙指南; 法律協(xié)議; 資質(zhì)公示

智聯(lián)招聘更懂你的價值

智聯(lián)app小程序官方微信企業(yè)版APP

未經(jīng) Zhaopin.com 同意，不得轉(zhuǎn)載本網(wǎng)站之所有招聘信息及作品智聯(lián)招聘網(wǎng)版權(quán)所有

京ICP備12025925號?京ICP證010207號

京公網(wǎng)安備 11010502059392號?人力資源許可證:1101051996081號

網(wǎng)上有害信息舉報專區(qū)?違法不良信息舉報電話:400-885-9898 關(guān)愛未成年舉報熱線:400-885-9898-3

朝陽區(qū)人力資源與社會保障局監(jiān)督電話?

網(wǎng)絡(luò)110報警服務(wù)電子營業(yè)執(zhí)照