国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 12月16日

數(shù)據(jù)工程師(LLM數(shù)據(jù)標(biāo)注與平臺(tái)搭建方向)

5000-8000元
  • 重慶九龍坡區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招1人

職位描述

圖像標(biāo)注語(yǔ)音標(biāo)注音頻標(biāo)注視頻標(biāo)注文本標(biāo)注云計(jì)算/大數(shù)據(jù)人工智能計(jì)算機(jī)軟件工業(yè)自動(dòng)化專業(yè)技術(shù)服務(wù)工程技術(shù)與設(shè)計(jì)服務(wù)
一、崗位職責(zé)
? 負(fù)責(zé)LLM相關(guān)數(shù)據(jù)的格式標(biāo)注工作,制定標(biāo)注規(guī)范與質(zhì)量校驗(yàn)標(biāo)準(zhǔn),保障標(biāo)注數(shù)據(jù)的準(zhǔn)確性、一致性,支撐大模型訓(xùn)練、微調(diào)及優(yōu)化場(chǎng)景的數(shù)據(jù)需求。
? 基于Java技術(shù)棧搭建及迭代數(shù)據(jù)平臺(tái),涵蓋數(shù)據(jù)采集、清洗、存儲(chǔ)、標(biāo)注流轉(zhuǎn)、檢索等核心模塊,實(shí)現(xiàn)數(shù)據(jù)處理全流程的自動(dòng)化與高效化。
? 參與數(shù)據(jù)平臺(tái)的架構(gòu)設(shè)計(jì)與技術(shù)選型,解決平臺(tái)運(yùn)行中的高可用、高性能問(wèn)題,保障海量LLM標(biāo)注數(shù)據(jù)的穩(wěn)定處理與安全存儲(chǔ)。
? 協(xié)同算法團(tuán)隊(duì)梳理數(shù)據(jù)需求,優(yōu)化標(biāo)注流程與數(shù)據(jù)處理鏈路,提升數(shù)據(jù)交付效率,助力大模型在相關(guān)業(yè)務(wù)場(chǎng)景的落地應(yīng)用。
? 負(fù)責(zé)數(shù)據(jù)平臺(tái)相關(guān)文檔的編寫(xiě)與維護(hù),包括技術(shù)設(shè)計(jì)文檔、操作手冊(cè)、標(biāo)注規(guī)范文檔等,保障團(tuán)隊(duì)協(xié)作順暢。
二、核心技術(shù)能力
1. LLM數(shù)據(jù)標(biāo)注能力
精通LLM相關(guān)數(shù)據(jù)的格式標(biāo)注規(guī)則,熟悉常見(jiàn)LLM數(shù)據(jù)類型(如對(duì)話生成、文本分類、信息抽取、prompt工程、知識(shí)庫(kù)問(wèn)答等)的標(biāo)注方法;熟練使用LabelStudio等主流數(shù)據(jù)標(biāo)注工具,具備標(biāo)注工具配置、流程自定義及批量標(biāo)注處理的實(shí)戰(zhàn)經(jīng)驗(yàn);具備標(biāo)注規(guī)范制定、標(biāo)注質(zhì)量把控、標(biāo)注問(wèn)題排查的實(shí)戰(zhàn)能力,能有效提升標(biāo)注團(tuán)隊(duì)的工作效率與數(shù)據(jù)質(zhì)量。
2. Java開(kāi)發(fā)能力
具備5年以上Java開(kāi)發(fā)實(shí)戰(zhàn)經(jīng)驗(yàn),精通Java開(kāi)發(fā)語(yǔ)言,熟悉JDK8及以上版本特性;深入理解面向?qū)ο缶幊趟枷?,扎?shí)掌握集合框架、多線程并發(fā)、IO流等基礎(chǔ)技術(shù),能熟練運(yùn)用Spring、Spring Boot、MyBatis等主流開(kāi)發(fā)框架進(jìn)行項(xiàng)目開(kāi)發(fā)、迭代及問(wèn)題優(yōu)化;具備Java項(xiàng)目性能調(diào)優(yōu)、故障排查的豐富經(jīng)驗(yàn)。
3. 數(shù)據(jù)平臺(tái)搭建能力
具備完整的數(shù)據(jù)平臺(tái)搭建實(shí)戰(zhàn)經(jīng)驗(yàn),熟悉數(shù)據(jù)平臺(tái)的核心架構(gòu)(數(shù)據(jù)采集層、處理層、存儲(chǔ)層、應(yīng)用層);能獨(dú)立完成數(shù)據(jù)采集腳本開(kāi)發(fā)、數(shù)據(jù)清洗規(guī)則實(shí)現(xiàn)、標(biāo)注流程模塊搭建、數(shù)據(jù)存儲(chǔ)方案設(shè)計(jì)(如MySQL、Redis、Hadoop等);熟練掌握RAG(檢索增強(qiáng)生成)技術(shù)原理與落地實(shí)踐,能將RAG技術(shù)融入數(shù)據(jù)平臺(tái),實(shí)現(xiàn)標(biāo)注數(shù)據(jù)的高效檢索、知識(shí)庫(kù)構(gòu)建及與大模型的協(xié)同應(yīng)用。
4. 數(shù)據(jù)處理與工具應(yīng)用
熟悉常見(jiàn)的數(shù)據(jù)處理工具與技術(shù),能應(yīng)對(duì)海量數(shù)據(jù)的清洗、轉(zhuǎn)換、格式標(biāo)準(zhǔn)化等需求;了解數(shù)據(jù)可視化工具的使用,可實(shí)現(xiàn)標(biāo)注數(shù)據(jù)質(zhì)量、平臺(tái)運(yùn)行狀態(tài)等關(guān)鍵指標(biāo)的可視化展示;了解Python語(yǔ)言及相關(guān)數(shù)據(jù)處理庫(kù)(如Pandas、Numpy)者優(yōu)先。
三、任職資格
? 5年以上相關(guān)工作經(jīng)驗(yàn),其中包含5年以上Java開(kāi)發(fā)經(jīng)驗(yàn)及1年以上LLM數(shù)據(jù)格式標(biāo)注實(shí)戰(zhàn)經(jīng)驗(yàn),熟練使用LabelStudio等數(shù)據(jù)標(biāo)注工具、具備RAG技術(shù)落地經(jīng)驗(yàn)及完整數(shù)據(jù)平臺(tái)搭建項(xiàng)目經(jīng)歷者優(yōu)先。
? 本科及以上學(xué)歷(能力突出者可放寬),計(jì)算機(jī)科學(xué)與技術(shù)、數(shù)據(jù)科學(xué)、軟件工程等相關(guān)專業(yè)優(yōu)先;深入理解LLM數(shù)據(jù)標(biāo)注的核心價(jià)值,清楚標(biāo)注數(shù)據(jù)對(duì)大模型性能的影響。
? 具備良好的問(wèn)題排查能力,能快速定位并解決數(shù)據(jù)標(biāo)注過(guò)程中的格式問(wèn)題、平臺(tái)運(yùn)行中的技術(shù)故障。
? 關(guān)注數(shù)據(jù)領(lǐng)域與大模型相關(guān)技術(shù)趨勢(shì),具備較強(qiáng)的學(xué)習(xí)能力與創(chuàng)新意識(shí),能積極探索數(shù)據(jù)標(biāo)注與數(shù)據(jù)平臺(tái)優(yōu)化的新方法、新技術(shù)。
? 具備良好的溝通表達(dá)能力與跨團(tuán)隊(duì)協(xié)作精神,能高效配合算法、產(chǎn)品等團(tuán)隊(duì)完成工作;具備嚴(yán)謹(jǐn)?shù)倪壿嬎季S與文檔編寫(xiě)能力。
四、優(yōu)先條件
? 有大模型訓(xùn)練/微調(diào)相關(guān)數(shù)據(jù)標(biāo)注項(xiàng)目經(jīng)驗(yàn),熟悉特定行業(yè)(如智能制造、金融、醫(yī)療等)LLM數(shù)據(jù)標(biāo)注場(chǎng)景者優(yōu)先。
? 熟悉分布式數(shù)據(jù)存儲(chǔ)與計(jì)算技術(shù)(如Hadoop、Spark、Flink等),具備大數(shù)據(jù)平臺(tái)搭建與優(yōu)化經(jīng)驗(yàn)者優(yōu)先。
? 了解LangChain、Spring AI等大模型應(yīng)用開(kāi)發(fā)框架,或有數(shù)據(jù)標(biāo)注工具二次開(kāi)發(fā)經(jīng)驗(yàn)者優(yōu)先。
? 具備數(shù)據(jù)安全、數(shù)據(jù)脫敏相關(guān)實(shí)踐經(jīng)驗(yàn),熟悉數(shù)據(jù)合規(guī)相關(guān)要求者優(yōu)先。

工作地點(diǎn)

九龍坡區(qū)重慶理工大學(xué)國(guó)家大學(xué)科技園

職位發(fā)布者

李轉(zhuǎn)紅/人事經(jīng)理

三日內(nèi)活躍
立即溝通