崗位綜述: 作為算法研究組和工程開發(fā)組之間的橋梁,負責構(gòu)建和維護高質(zhì)量的 AI 數(shù)據(jù)資產(chǎn),確保算法模型迭代擁有穩(wěn)定、準確的數(shù)據(jù)源。
核心職責:
1.負責 AI 項目所需數(shù)據(jù)的采集、清洗、預(yù)處理和標注管理,確保數(shù)據(jù)質(zhì)量和一致性。
2.建立和維護自動化數(shù)據(jù)流水線(Data Pipeline),提高數(shù)據(jù)處理效率。
3.負責 LLMBase 的向量數(shù)據(jù)庫選型、部署、維護和性能調(diào)優(yōu),支撐 WareAI 知識智能體。
4.與算法工程師緊密協(xié)作,根據(jù)模型需求定制化數(shù)據(jù)增強和采樣策略。
5.負責數(shù)據(jù)安全和隱私保護,建立數(shù)據(jù)訪問權(quán)限管理機制。
任職要求:
1.計算機或數(shù)據(jù)科學(xué)相關(guān)專業(yè)本科及以上學(xué)歷,2 年以上數(shù)據(jù)工程或數(shù)據(jù)標注管理經(jīng)驗優(yōu)先。
2.熟練掌握 Python 編程,熟悉 SQL/NoSQL 數(shù)據(jù)庫操作。
3.熟悉主流數(shù)據(jù)處理工具(如 Pandas, Spark)和數(shù)據(jù)倉庫概念。
4.具備向量數(shù)據(jù)庫(如 Milvus, Pinecone, ChromaDB)的實際使用經(jīng)驗者優(yōu)先。
5.了解計算機視覺或自然語言處理領(lǐng)域的數(shù)據(jù)標注規(guī)范和工具。
職位福利:五險、績效獎金、年終分紅、包吃住、餐補、通訊補助。