崗位職責(zé)
1)使用Doccano平臺(tái)進(jìn)行文本標(biāo)注(意圖識(shí)別、實(shí)體標(biāo)注、問(wèn)答對(duì)匹配等),構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集
2)基于BERT等嵌入模型將客服問(wèn)答文本轉(zhuǎn)化為向量,優(yōu)化向量化流程,維護(hù)向量數(shù)據(jù)庫(kù)(如Milvus/FAISS/Pinecone),實(shí)現(xiàn)語(yǔ)義檢索與相似度計(jì)算功能
3)開(kāi)發(fā)Python自動(dòng)化腳本,完成數(shù)據(jù)預(yù)處理、模型評(píng)估及標(biāo)注結(jié)果分析,與算法團(tuán)隊(duì)協(xié)作,持續(xù)改進(jìn)標(biāo)注規(guī)范與模型效果
任職要求
技術(shù)能力:
1)熟練掌握Python及NLP相關(guān)庫(kù)(spaCy、HuggingFace Transformers等)
2)有Doccano標(biāo)注經(jīng)驗(yàn),能設(shè)計(jì)標(biāo)注方案并管理標(biāo)注團(tuán)隊(duì)
3)理解嵌入模型原理,能獨(dú)立實(shí)現(xiàn)文本向量化與存儲(chǔ)
4)熟悉向量數(shù)據(jù)庫(kù)操作(Milvus/Weaviate等)及檢索優(yōu)化技巧
加分項(xiàng)
有客服對(duì)話系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn)
熟悉RAG(檢索增強(qiáng)生成)技術(shù)棧
掌握Docker/Kubernetes部署流程
工作亮點(diǎn)
參與從數(shù)據(jù)標(biāo)注到模型落地的全流程
接觸前沿的向量化與語(yǔ)義檢索技術(shù)
提供技術(shù)成長(zhǎng)與跨團(tuán)隊(duì)協(xié)作機(jī)會(huì)