崗位職責(zé):
1.專注于圖像識(shí)別和自然語言處理(NLP)的端側(cè)模型,負(fù)責(zé)開發(fā)、優(yōu)化和部署輕量級(jí)AI模型到移動(dòng)端(Android/iOS)或嵌入式設(shè)備(如IoT設(shè)備),將參與從算法選型到落地部署的全流程,推動(dòng)AI技術(shù)在端側(cè)的高效應(yīng)用。
2.開發(fā)與優(yōu)化輕量級(jí)圖像識(shí)別(如目標(biāo)檢測、分類)和NLP(如文本分類、語音識(shí)別)模型,確保其在端側(cè)設(shè)備的高效運(yùn)行。
3.使用模型壓縮技術(shù)(如量化、剪枝、知識(shí)蒸餾)和硬件加速(NPU/GPU/DSP)提升模型性能。
4.實(shí)現(xiàn)端側(cè)模型的跨平臺(tái)部署(TensorFlow Lite、Core ML、ONNX Runtime等)。
5.與算法團(tuán)隊(duì)協(xié)作,針對(duì)端側(cè)場景定制模型架構(gòu)(如MobileNet、EfficientNet、BERT-Tiny等)。
6.監(jiān)控端側(cè)模型的實(shí)時(shí)性能(延遲、內(nèi)存、功耗),持續(xù)優(yōu)化用戶體驗(yàn)。
7.跟蹤前沿技術(shù)(如Transformer輕量化、多模態(tài)模型端側(cè)部署),推動(dòng)技術(shù)落地。
任職要求:
1、學(xué)歷:本科及以上學(xué)歷
2、專業(yè):計(jì)算機(jī)科學(xué)、電子工程、數(shù)學(xué)等相關(guān)專業(yè)
3、工作經(jīng)驗(yàn):
4、能力要求:
(1)熟練掌握Python/C++,熟悉主流深度學(xué)習(xí)框架(PyTorch/TensorFlow)。
(2)熟悉端側(cè)部署工具鏈(NCNN、MNN、ONNX、TFLite、ML Kit、Qualcomm SNPE等)。
(3)精通模型壓縮技術(shù)(量化、剪枝)和端側(cè)性能調(diào)優(yōu)(ARM架構(gòu)經(jīng)驗(yàn)加分)。
(4)在圖像識(shí)別(CV)或NLP領(lǐng)域有實(shí)際項(xiàng)目經(jīng)驗(yàn)(如食材識(shí)別、OCR、語音助手等)。
(5)了解端側(cè)開發(fā)(Android NDK/iOS Core ML或嵌入式Linux)
5、加分項(xiàng):
(1)有MCU(如STM32)或邊緣設(shè)備(Jetson、樹莓派)部署經(jīng)驗(yàn)。
(2)熟悉異構(gòu)計(jì)算(OpenCL/Vulkan)或編譯器優(yōu)化(TVM/MLIR)。
(3)發(fā)表過相關(guān)論文或開源項(xiàng)目貢獻(xiàn)者優(yōu)先。