崗位職責(zé):
1、負(fù)責(zé)核心AI算法(自然語(yǔ)言處理、計(jì)算機(jī)視覺、推薦系統(tǒng)等)的全流程測(cè)試工作,包括需求評(píng)審、測(cè)試方案設(shè)計(jì)、
2、測(cè)試執(zhí)行及線上質(zhì)量監(jiān)控。建立并持續(xù)優(yōu)化算法效果評(píng)估體系,綜合運(yùn)用離線指標(biāo)(準(zhǔn)確率、召回率、F1、BLEU等)和線上業(yè)務(wù)指標(biāo),全面評(píng)估模型效果。
3、主導(dǎo)數(shù)據(jù)標(biāo)注規(guī)范的評(píng)審與優(yōu)化,負(fù)責(zé)數(shù)據(jù)集的質(zhì)量驗(yàn)收,識(shí)別并推動(dòng)解決數(shù)據(jù)分布偏差、標(biāo)注不一致等深層次質(zhì)量問題。
4、推動(dòng)建立數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)和數(shù)據(jù)血緣追蹤機(jī)制,保障數(shù)據(jù)鏈路的完整性和可追溯性。
5、開發(fā)和維護(hù)算法自動(dòng)化測(cè)試框架與工具平臺(tái),實(shí)現(xiàn)模型批量測(cè)試、性能壓測(cè)(QPS、延遲、吞吐量)和資源消耗監(jiān)控(GPU/內(nèi)存)的自動(dòng)化。
6、搭建和維護(hù)算法持續(xù)測(cè)試流水線(CI/CD for ML),支持模型的快速迭代和自動(dòng)化回歸。
7、主導(dǎo)模型上線前的驗(yàn)收測(cè)試,參與A/B測(cè)試方案設(shè)計(jì)與效果分析,保障模型推理結(jié)果在離線環(huán)境和生產(chǎn)環(huán)境的一致性,及時(shí)發(fā)現(xiàn)并定位線上問題。
任職要求:
1.、本科及以上學(xué)歷,計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)或相關(guān)專業(yè),3年左右AI算法測(cè)試或開發(fā)經(jīng)驗(yàn)。
2、深入理解軟件測(cè)試?yán)碚摵头椒?,具備?dú)立負(fù)責(zé)模塊/項(xiàng)目測(cè)試的能力,有良好的用例設(shè)計(jì)思維和問題定位能力。
3、編程能力: 熟練掌握 Python,具備良好的代碼能力,能夠獨(dú)立開發(fā)自動(dòng)化測(cè)試腳本和工具。
4、AI基礎(chǔ): 熟悉機(jī)器學(xué)習(xí)/深度學(xué)習(xí)基礎(chǔ)理論,了解常見算法模型(如CNN、RNN、Transformer)的原理和適用場(chǎng)景,能夠理解算法設(shè)計(jì)思路并提出測(cè)試建議。
5、工具使用: 熟悉Linux環(huán)境,熟悉 Pytorch/TensorFlow 的基本使用;熟悉Docker;有模型服務(wù)化測(cè)試經(jīng)驗(yàn)者優(yōu)先。