崗位職責;
1、負責 AI 相關業(yè)務的數(shù)據(jù)獲取與數(shù)據(jù)生產(chǎn)體系建設,搭建穩(wěn)定高效的外部數(shù)據(jù)采集能力;
2、規(guī)劃并落地 AI 訓練數(shù)據(jù)全流程,包括數(shù)據(jù)采集、清洗、標注、增強及質(zhì)量控制;
3、推動數(shù)據(jù)能力與 AI 模型訓練、自動化業(yè)務場景深度結(jié)合,持續(xù)提升數(shù)據(jù)價值與業(yè)務效果;
4、持續(xù)關注爬蟲技術、數(shù)據(jù)工程及 AI 數(shù)據(jù)生產(chǎn)領域的新技術與行業(yè)趨勢,推動技術能力持續(xù)演進。
崗位要求:
1、本科及以上學歷,計算機科學、軟件工程、數(shù)據(jù)工程、人工智能等相關專業(yè)優(yōu)先;
2、3 年以上爬蟲開發(fā)或數(shù)據(jù)工程相關經(jīng)驗,具備大規(guī)模數(shù)據(jù)采集與處理實戰(zhàn)經(jīng)驗;
3、精通 Python 爬蟲開發(fā),熟悉常見反爬策略及應對方案(動態(tài)渲染、驗證碼、風控機制等);
4、熟悉數(shù)據(jù)處理與 ETL 流程,具備數(shù)據(jù)清洗、去重、結(jié)構化處理及質(zhì)量評估能力;
5、熟悉至少一種數(shù)據(jù)標注或眾包標注流程,了解任務拆分、質(zhì)量抽檢及標注規(guī)范設計;
6、具備良好的溝通能力與跨團隊協(xié)作能力,能夠推動數(shù)據(jù)能力在業(yè)務中的落地。