職位描述
崗位職責(zé):
ByteIntern:面向2026屆畢業(yè)生(2025年9月-2026年8月期間畢業(yè)),為符合崗位要求的同學(xué)提供轉(zhuǎn)正機(jī)會(huì)。
團(tuán)隊(duì)介紹:CQC(中國(guó)內(nèi)容質(zhì)量與數(shù)據(jù)服務(wù)平臺(tái))歸屬于抖音集團(tuán),負(fù)責(zé)今日頭條、抖音、西瓜等產(chǎn)品內(nèi)容和抖音集團(tuán)商業(yè)內(nèi)容的安全質(zhì)量與體驗(yàn),支持各產(chǎn)品的運(yùn)營(yíng)和增長(zhǎng),以及為產(chǎn)品線提供AI算法算力的基礎(chǔ)支持服務(wù)。
1、參與大語(yǔ)言模型在垂直領(lǐng)域的數(shù)據(jù)生產(chǎn)與優(yōu)化,負(fù)責(zé)通用主題問(wèn)題的理解與邏輯拆解,明確任務(wù)目標(biāo)與關(guān)鍵信息,針對(duì)模型生成的初始回答,識(shí)別邏輯漏洞或語(yǔ)言不通順之處,通過(guò)自動(dòng)化手段進(jìn)行高質(zhì)量改寫,確保標(biāo)注數(shù)據(jù)的準(zhǔn)確性與實(shí)驗(yàn)有效性;
2、從用戶視角理解并處理復(fù)雜開(kāi)放式問(wèn)題,具備良好的問(wèn)題拆解與關(guān)鍵詞提取能力,邏輯清晰地補(bǔ)全思考鏈路,能夠自然流暢地組織信息,進(jìn)行事實(shí)、推理、觀點(diǎn)的區(qū)分與表達(dá),擅長(zhǎng)識(shí)別模型輸出中的邏輯不一致與語(yǔ)義偏差;
3、跨團(tuán)隊(duì)協(xié)作,與算法、產(chǎn)品等團(tuán)隊(duì)緊密配合,深入理解垂類方向用戶需求及模型特性,不斷迭代標(biāo)注標(biāo)準(zhǔn),提升數(shù)據(jù)質(zhì)量與準(zhǔn)確性;
4、關(guān)注行業(yè)動(dòng)態(tài)與先進(jìn)實(shí)踐,持續(xù)關(guān)注大語(yǔ)言模型的發(fā)展趨勢(shì),探索數(shù)據(jù)生產(chǎn)在模型能力提升中的作用,學(xué)習(xí)并應(yīng)用行業(yè)先進(jìn)的數(shù)據(jù)生產(chǎn)方法于數(shù)據(jù)生產(chǎn)工作中。
任職要求:
1、2026屆本科及以上學(xué)歷在讀,計(jì)算機(jī)、數(shù)學(xué)、數(shù)據(jù)科學(xué)、哲學(xué)、邏輯學(xué)等專業(yè)優(yōu)先;
2、計(jì)算機(jī)、數(shù)學(xué)背景同學(xué)技能基礎(chǔ),精通至少一門編程語(yǔ)言(Python/C++/Java等),數(shù)據(jù)結(jié)構(gòu)與算法基礎(chǔ)扎實(shí),代碼規(guī)范良好,熟練使用至少一種深度學(xué)習(xí)框架(PyTorch/TensorFlow等),熟悉模型訓(xùn)練、調(diào)參與基礎(chǔ)部署流程,熟悉主流開(kāi)源大模型與生態(tài)(如DeepSeek/Qwen/LLama等),具備Prompt設(shè)計(jì)、RAG搭建與微調(diào)相關(guān)經(jīng)驗(yàn),在以下至少一個(gè)方向具備深入研究與落地經(jīng)驗(yàn):中文分詞、文本分類、語(yǔ)義表示、語(yǔ)義匹配、主題模型、篇章/組塊分析、信息抽取、對(duì)話管理、知識(shí)圖譜構(gòu)建與應(yīng)用等;
3、AI應(yīng)用經(jīng)驗(yàn),熟練使用主流大語(yǔ)言模型產(chǎn)品,具備一定AI理解力,有Agent、模型訓(xùn)練實(shí)踐經(jīng)驗(yàn)者優(yōu)先;
4、探索與創(chuàng)新能力,對(duì)新技術(shù)與AI應(yīng)用場(chǎng)景有濃厚興趣和主觀能動(dòng)性,具備科研背景或強(qiáng)探索精神者優(yōu)先;
5、通用素質(zhì),具有較強(qiáng)的自驅(qū)力、抗壓能力與學(xué)習(xí)能力(包括論文理解與研究能力),具備清晰的表達(dá)與獨(dú)立判斷能力,溝通協(xié)調(diào)能力與團(tuán)隊(duì)合作意識(shí)優(yōu)秀。