工作地點:深圳天安云谷
服務部門:AI數(shù)據(jù)
業(yè)務對象:pangu大模型、行業(yè)模型
工作內(nèi)容:多模態(tài)數(shù)據(jù)處理(文本、語音、圖像[崗位已滿]),數(shù)據(jù)平臺開發(fā)(后端)
成長平臺:駐場HW、對接HW技術、HW集群和資源平臺和、自研大模型
【崗位一 Python后端開發(fā)】(招聘2人)
1、python技能必須熟練,接受手撕python代碼,熟悉Python后端開發(fā);
2、本科一年以上工作經(jīng)驗,計算機/軟件相關碩士可以應屆;
3、院校好,相關專業(yè)優(yōu)先考慮,有NLP大模型相關經(jīng)驗的優(yōu)先考慮;
【崗位二 python文本數(shù)據(jù)/NLP算法】(招聘4人)
1、python技能必須熟練,接受手撕python代碼,有Python文本或NLP算法開發(fā)經(jīng)驗;
2、本科兩年以上相關工作經(jīng)驗,計算機/軟件類碩士可以應屆;
3、院校好,相關專業(yè)優(yōu)先考慮,有NLP大模型相關經(jīng)驗的優(yōu)先考慮;
【崗位三 Python語音數(shù)據(jù)/流媒體開發(fā)】(招聘1人)
1、python技能必須熟練,接受手撕python代碼;
2、本科一年以上語音數(shù)據(jù)處理經(jīng)驗,音頻技能關鍵詞有ffmpeg,torchaudio,librosa,pydub;
3、院校好,相關專業(yè)優(yōu)先考慮,有NLP大模型相關經(jīng)驗的優(yōu)先考慮;
【工作職責】
1、負責多模態(tài)大模型數(shù)據(jù)語料生產(chǎn)和處理,包括但不限于數(shù)據(jù)生成增強、分布研究、數(shù)據(jù)獲取、數(shù)據(jù)規(guī)范化、數(shù)據(jù)質(zhì)量檢測、打標等,確保訓練數(shù)據(jù)的有效性,可用性;
2、負責優(yōu)化和改進現(xiàn)有的數(shù)據(jù)清洗和質(zhì)檢打標流程,提高效率和準確性;
3、負責大模型相關數(shù)據(jù)工具鏈的開發(fā)實現(xiàn)及應用維護等;