国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 12月10日

模型評估與測試工程師

1.5-2.4萬
  • 北京海淀區(qū)
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

Python自動化測試模型性能測試真機測試機器人與仿真技術(shù)AI模型ROS/ROS2具身智能深度分析安全驗證人工智能
【崗位職責(zé)】
1 、評估體系與基準構(gòu)建
負責(zé)設(shè)計、構(gòu)建和維護具身大腦模型的端到端評估體系,定義科學(xué)、全面的評估指標,涵蓋任務(wù)成功率、效率、魯棒性、泛化能力、安全性等多個維度。主導(dǎo)開發(fā)和維護標準化的評估基準,涵蓋仿真環(huán)境(如Libero、CALVIN、自定義場景)和真實機器人任務(wù),確保評估的可比性和可復(fù)現(xiàn)性。
2 、自動化測試與流水線開發(fā)
開發(fā)自動化的模型測試框架和CI/CD流水線,實現(xiàn)模型更新后的自動化回歸測試,快速發(fā)現(xiàn)性能衰退和功能缺陷。設(shè)計并實現(xiàn)多樣化的測試用例,包括正常場景、邊界場景和異常場景,系統(tǒng)性地挖掘模型潛在問題。
3 、模型性能評估與深度分析
執(zhí)行大規(guī)模的模型評估實驗,收集、整理和分析海量評估數(shù)據(jù),生成清晰的評估報告和可視化圖表,為模型迭代提供數(shù)據(jù)驅(qū)動的決策支持。對模型失敗案例進行深入的根本原因分析,定位問題是出在感知、規(guī)劃、決策還是控制環(huán)節(jié),并形成詳細的“Bug Report”反饋給算法團隊。
4 、真機測試與安全驗證
負責(zé)模型在真實機器人(機械臂、機器狗、無人機)上的部署測試,制定并執(zhí)行嚴格的安全測試協(xié)議,確保測試過程的人員和設(shè)備安全。在真實環(huán)境中驗證模型的Sim2Real效果,評估其在光照變化、背景干擾、硬件噪聲等復(fù)雜條件下的實際表現(xiàn)。
5 、評估工具與平臺開發(fā)
開發(fā)和維護可視化的評估結(jié)果展示平臺(Dashboard),讓團隊成員能直觀地了解模型性能、對比不同版本、追蹤關(guān)鍵指標。編寫和維護評估相關(guān)的技術(shù)文檔、測試規(guī)范和操作手冊,提升團隊評估工作的規(guī)范化和效率。
【崗位要求】
1 、學(xué)歷與專業(yè)背景
計算機科學(xué)、機器人、自動化、電子信息等相關(guān)專業(yè)本科及以上學(xué)歷,擁有2年以上AI模型測試、機器人系統(tǒng)測試或相關(guān)質(zhì)量保證經(jīng)驗。
2 、核心測試與評估能力
深刻理解AI模型(特別是多模態(tài)模型、強化學(xué)習(xí)模型)的評估方法論,熟悉準確率、召回率、F1-score等傳統(tǒng)指標,并理解任務(wù)成功率、樣本效率、魯棒性等具身智能專屬指標。具備優(yōu)秀的測試用例設(shè)計能力,能夠從用戶需求和系統(tǒng)架構(gòu)出發(fā),設(shè)計出覆蓋全面、重點突出的測試方案。
3、 機器人與仿真技術(shù)
熟悉ROS/ROS2,能夠使用ROS工具鏈監(jiān)控機器人狀態(tài)、發(fā)布指令和分析日志。熟練使用至少一種主流仿真環(huán)境(如Gazebo、Isaac Sim、AirSim),能夠在仿真中搭建測試場景并執(zhí)行自動化測試。
4 、編程與工具能力
精通Python,具備扎實的腳本開發(fā)和自動化能力,熟悉pytest等測試框架。
熟悉數(shù)據(jù)處理和可視化庫,如Pandas、NumPy、Matplotlib、Seaborn,能夠高效地處理和分析評估數(shù)據(jù)。有使用Weights & Biases (WB)、MLflow等實驗管理工具的經(jīng)驗者優(yōu)先。
5、 AI模型理解
對具身智能有濃厚興趣,了解VLA模型、強化學(xué)習(xí)、多模態(tài)融合等基本概念,不需要會設(shè)計模型,但需要理解其輸入、輸出和基本工作原理。有閱讀和理解AI模型技術(shù)文檔的能力,能夠與算法工程師進行高效的技術(shù)溝通。
6 、軟技能與綜合素質(zhì)
具備極強的細心、耐心和責(zé)任心,對發(fā)現(xiàn)問題和追蹤問題根源有強烈熱情。
具備出色的邏輯思維能力和問題分析能力,能夠從復(fù)雜的現(xiàn)象中定位問題的本質(zhì)。具備良好的溝通能力和團隊協(xié)作精神,能夠清晰、準確地描述問題,并推動問題解決。

工作地點

北京海淀區(qū)中關(guān)新園壹號北清路81號院AI樓21層

職位發(fā)布者

潘靖雯/HRM

三日內(nèi)活躍
立即溝通
公司Logo北京清創(chuàng)智科科技有限公司
同方股份有限公司成立于1997年6月,由清華大學(xué)出資成立的高科技上市企業(yè)。2019年12月,同方股份控股股東由清華控股變更為中國核工業(yè)集團,成為中核集團控股企業(yè)。北京清創(chuàng)智科科技有限公司(原北京同方智科科技有限公司)成立于2005年,隸屬于同方股份科工產(chǎn)業(yè)本部,同方軍工產(chǎn)業(yè)的骨干企業(yè)之一,中核下屬的軍工企業(yè),是清華大學(xué)與同方整體技術(shù)力量資源對軍隊服務(wù)的窗口。公司具備完善的軍工資質(zhì),具有人工智能模型和大模型應(yīng)用開發(fā)工具和智能仿真推演工具,常年從事軍工人工智能業(yè)務(wù),為多家單位提供人工智能開發(fā)平臺智能仿真平臺和指揮決策類,裝備類,訓(xùn)練類智能模型和智能體,應(yīng)用在情報處理,作戰(zhàn)籌劃,仿真推演,作戰(zhàn)評估等多個環(huán)節(jié)。公司戰(zhàn)略定位:“專業(yè)的AI學(xué)習(xí)平臺+領(lǐng)先的軍事決策智能”公司主營業(yè)務(wù):基于自身技術(shù)積累,依托清華大學(xué)的科研實力與人才平臺,建立以人工智能強化學(xué)習(xí)平臺、模擬仿真、大模型微調(diào)管理工具集為產(chǎn)品,軍事智能應(yīng)用為核心方向的業(yè)務(wù)發(fā)展體系。公司技術(shù)方向:基于深度學(xué)習(xí)、強化學(xué)習(xí)、大模型、并行計算等相關(guān)技術(shù),自主研發(fā)軍工級智能體開發(fā)平臺,推動大模型從“生成式AI”到“生產(chǎn)力”,提供大模型落地應(yīng)用底層技術(shù),推動大模型完成落地最后一公里,完成可信自主智能體生成替代傳統(tǒng)AI應(yīng)用方式,致力于幫助客戶構(gòu)建私有、安全、可信的AI系統(tǒng)。
公司主頁