崗位職責:
負責企業(yè)級AI系統(tǒng)架構設計、技術選型與核心模塊開發(fā),構建高可用、可擴展的AI基礎設施。
主導機器學習/深度學習模型全流程開發(fā),包括設計、訓練、優(yōu)化與部署,確保模型高效性和業(yè)務適配性。
開發(fā)AI工程化解決方案(如基于Nvidia AI技術棧),如分布式訓練框架、模型服務化及自動化推理流水線。
設計AI系統(tǒng)性能優(yōu)化方案,涵蓋計算資源調(diào)度、模型壓縮與量化加速。
制定AI開發(fā)規(guī)范與工程標準,建立模型版本管理、監(jiān)控告警、A/B測試等MLOps體系。
跟蹤前沿AI技術,推動技術成果在業(yè)務場景中落地,實現(xiàn)AI解決方案規(guī)?;瘧?。
任職要求:
3年以上AI工程化開發(fā)經(jīng)驗,熟悉分布式系統(tǒng)設計與高并發(fā)優(yōu)化,具備CUDA編程經(jīng)驗優(yōu)先。
深入理解機器學習原理,掌握Transformer等主流模型架構及其工程實現(xiàn)。
熟悉Nvidia AI技術棧優(yōu)先,如NIM、Nemo、vGPU、ruanAI等。
熟悉Docker/Kubernetes云原生技術棧,熟悉LLM微調(diào)部署、RAG應用開發(fā)等生成式AI技術。
具備技術前瞻性與系統(tǒng)設計能力,能快速轉化前沿AI論文成果,平衡技術先進性與工程可行性。
具備責任心與自驅力,適應快節(jié)奏技術迭代環(huán)境,有出色的技術文檔撰寫與方案宣講能力。
計算機科學、數(shù)學、統(tǒng)計學或相關專業(yè)本科及以上學歷。