職位:CV視覺算法工程師
崗位職責(zé):
參與公司計(jì)算機(jī)視覺算法的設(shè)計(jì)、開發(fā)與優(yōu)化,涵蓋目標(biāo)檢測、圖像分割、OCR識別、圖像分類等核心視覺任務(wù)的算法研發(fā)與迭代;
負(fù)責(zé)基于YOLO系列(YOLOv5/v8/v11/YOLOX等)、RT-DETR等主流檢測框架的模型選型、訓(xùn)練調(diào)優(yōu)與部署落地;
參與視覺大模型(VLM)相關(guān)工作,包括視覺編碼器(ViT、SigLIP、InternViT等)的微調(diào)與適配、視覺-語言對齊模塊的優(yōu)化(如MLP Projector、Cross-Attention Bridge等);
負(fù)責(zé)視覺數(shù)據(jù)Pipeline的構(gòu)建與維護(hù),包括數(shù)據(jù)采集、清洗、標(biāo)注管理(Labelme/CVAT等)、數(shù)據(jù)增強(qiáng)策略設(shè)計(jì)與質(zhì)量控制;
參與模型的工程化部署與推理優(yōu)化,包括使用ONNX Runtime、TensorRT、OpenVINO等框架進(jìn)行模型量化、剪枝及端側(cè)/服務(wù)端推理加速;
基于OpenCV、Pillow等工具完成圖像預(yù)處理、后處理及傳統(tǒng)視覺算法(形態(tài)學(xué)操作、輪廓檢測、模板匹配等)的開發(fā)與集成;
跟蹤學(xué)術(shù)界與工業(yè)界在目標(biāo)檢測、視覺大模型、多模態(tài)理解等方向的前沿進(jìn)展,并在團(tuán)隊(duì)內(nèi)進(jìn)行分享與落地探索;
配合產(chǎn)品與工程團(tuán)隊(duì)完成視覺算法方案的聯(lián)調(diào)、測試與迭代。
任職資格:
計(jì)算機(jī)科學(xué)、人工智能、電子信息、自動化等相關(guān)專業(yè)本科及以上學(xué)歷;
熟練掌握Python和C++,具備良好的編程習(xí)慣和代碼能力;
掌握深度學(xué)習(xí)基礎(chǔ)理論,熟悉CNN、Transformer等主干網(wǎng)絡(luò)架構(gòu)原理(卷積操作、注意力機(jī)制、FPN/PAN特征融合等核心概念);
熟練使用OpenCV進(jìn)行圖像處理與分析,具備扎實(shí)的傳統(tǒng)視覺算法功底;
對YOLO系列檢測框架有深入理解和實(shí)際項(xiàng)目經(jīng)驗(yàn),熟悉Anchor-Free/Anchor-Based檢測范式、NMS后處理、多尺度檢測等關(guān)鍵技術(shù);
對視覺大模型(VLM)架構(gòu)有了解或?qū)嵺`經(jīng)驗(yàn),理解視覺編碼器(ViT、SigLIP等)的工作原理,了解視覺Token化、圖像分辨率適配(Dynamic Resolution、AnyRes等)策略者優(yōu)先;
熟悉PyTorch等主流深度學(xué)習(xí)框架,有MMDetection、Ultralytics、Detectron2等檢測工具鏈?zhǔn)褂媒?jīng)驗(yàn)者優(yōu)先;
具備良好的文獻(xiàn)閱讀能力和自驅(qū)學(xué)習(xí)習(xí)慣,能夠快速理解并復(fù)現(xiàn)前沿工作;
有天池競賽、CVPR/ECCV/ICCV等頂會論文發(fā)表、開源項(xiàng)目貢獻(xiàn)經(jīng)驗(yàn)者優(yōu)先。
加分項(xiàng):
有模型部署實(shí)戰(zhàn)經(jīng)驗(yàn)(TensorRT、ONNX、TFLite等),熟悉從訓(xùn)練到上線的完整鏈路
有多模態(tài)大模型相關(guān)研究或項(xiàng)目經(jīng)驗(yàn)(如Qwen-VL、InternVL、LLaVA等模型的訓(xùn)練或微調(diào))
有實(shí)際視覺應(yīng)用落地經(jīng)驗(yàn)(如工業(yè)質(zhì)檢、自動駕駛感知、安防監(jiān)控等場景)