職位描述:
1. 負責(zé)產(chǎn)品的功能測試、性能測試、自動化測試等工作,涵蓋大模型服務(wù)、數(shù)據(jù)平臺等。
2. 制定迭代版本驗收標(biāo)準(zhǔn)及對應(yīng)測試計劃,設(shè)計和執(zhí)行大模型落地產(chǎn)品的測試集及測試用例,評估系統(tǒng)的功能、性能和準(zhǔn)確性。
3. 分析測試結(jié)果,發(fā)現(xiàn)和報告問題,推動系統(tǒng)的改進和優(yōu)化。
4. 與其他團隊成員協(xié)作,推動項目的進展,確保模型的質(zhì)量和可靠性。
5. 撰寫測試報告,記錄測試結(jié)果和問題,評估其合理性、準(zhǔn)確性、場景匹配度,為團隊提供有價值的反饋。
6. 協(xié)助設(shè)計新的測試場景或任務(wù)流程,用于模型能力的覆蓋性評估。
職位要求:
1. 計算機科學(xué)、軟件工程、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷。
2. 5年以上軟件測試經(jīng)驗,2年以上AI/大模型測試經(jīng)驗。
3. 熟悉NLP、深度學(xué)習(xí)模型的測試方法與評測指標(biāo)。
4. 熟練掌握Python編程語言,精通Pytest、unittest等測試框架。
5. 有良好的邏輯思維和問題分析能力,善于總結(jié)行為模式或失敗原因;
6. 以下至少有一項需要滿足:(最好至少滿足大模型測試方向)
加分項:有LLM大模型相關(guān)項目經(jīng)歷
加分項:有0-1負責(zé)新項目經(jīng)歷或小組管理經(jīng)驗
加分項:全鏈路性能測試方案設(shè)計、執(zhí)行能力
加分項:有提效平臺搭建能力