崗位綜述: 作為算法研究組和工程開發(fā)組之間的橋梁,負(fù)責(zé)構(gòu)建和維護(hù)高質(zhì)量的 AI 數(shù)據(jù)資產(chǎn),確保算法模型迭代擁有穩(wěn)定、準(zhǔn)確的數(shù)據(jù)源。
核心職責(zé):
1.負(fù)責(zé) AI 項(xiàng)目所需數(shù)據(jù)的采集、清洗、預(yù)處理和標(biāo)注管理,確保數(shù)據(jù)質(zhì)量和一致性。
2.建立和維護(hù)自動(dòng)化數(shù)據(jù)流水線(Data Pipeline),提高數(shù)據(jù)處理效率。
3.負(fù)責(zé) LLMBase 的向量數(shù)據(jù)庫選型、部署、維護(hù)和性能調(diào)優(yōu),支撐 WareAI 知識(shí)智能體。
4.與算法工程師緊密協(xié)作,根據(jù)模型需求定制化數(shù)據(jù)增強(qiáng)和采樣策略。
5.負(fù)責(zé)數(shù)據(jù)安全和隱私保護(hù),建立數(shù)據(jù)訪問權(quán)限管理機(jī)制。
任職要求:
1.計(jì)算機(jī)或數(shù)據(jù)科學(xué)相關(guān)專業(yè)本科及以上學(xué)歷,2 年以上數(shù)據(jù)工程或數(shù)據(jù)標(biāo)注管理經(jīng)驗(yàn)優(yōu)先。
2.熟練掌握 Python 編程,熟悉 SQL/NoSQL 數(shù)據(jù)庫操作。
3.熟悉主流數(shù)據(jù)處理工具(如 Pandas, Spark)和數(shù)據(jù)倉庫概念。
4.具備向量數(shù)據(jù)庫(如 Milvus, Pinecone, ChromaDB)的實(shí)際使用經(jīng)驗(yàn)者優(yōu)先。
5.了解計(jì)算機(jī)視覺或自然語言處理領(lǐng)域的數(shù)據(jù)標(biāo)注規(guī)范和工具。
職位福利:五險(xiǎn)、績效獎(jiǎng)金、年終分紅、包吃住、餐補(bǔ)、通訊補(bǔ)助。