崗位職責(zé):
1,參與公司計(jì)算機(jī)視覺算法的設(shè)計(jì)、開發(fā)與優(yōu)化,涵蓋目標(biāo)檢測(cè)、圖像分割、OCR識(shí)別、圖像分類等核心視覺任務(wù)的算法研發(fā)與迭代;
2,負(fù)責(zé)基于YOLO系列(YOLOv5/v8/v11/YOLOX等)、RT-DETR等主流檢測(cè)框架的模型選型、訓(xùn)練調(diào)優(yōu)與部署落地;
3,微調(diào)與適配、視覺-語言對(duì)齊模塊的優(yōu)化(如MLP Projector、Cross-Attention Bridge等);
4,負(fù)責(zé)視覺數(shù)據(jù)Pipeline的構(gòu)建與維護(hù),包括數(shù)據(jù)采集、清洗、標(biāo)注管理(Labelme/CVAT等)、數(shù)據(jù)增強(qiáng)策略設(shè)計(jì)與質(zhì)量控制;
5,參與模型的工程化部署與推理優(yōu)化,包括使用ONNX Runtime、TensorRT、OpenVINO等框架進(jìn)行模型量化、剪枝及端側(cè)/服務(wù)端推理加速;
6,基于OpenCV、Pillow等工具完成圖像預(yù)處理、后處理及傳統(tǒng)視覺算法(形態(tài)學(xué)操作、輪廓檢測(cè)、模板匹配等)的開發(fā)與集成;
7,跟蹤學(xué)術(shù)界與工業(yè)界在目標(biāo)檢測(cè)、視覺大模型、多模態(tài)理解等方向的前沿進(jìn)展,并在團(tuán)隊(duì)內(nèi)進(jìn)行分享與落地探索;
8,配合產(chǎn)品與工程團(tuán)隊(duì)完成視覺算法方案的聯(lián)調(diào)、測(cè)試與迭代。
任職資格:
1,計(jì)算機(jī)科學(xué)、人工智能、電子信息、自動(dòng)化等相關(guān)專業(yè)本科及以上學(xué)歷;
2,熟練掌握Python和C++,具備良好的編程習(xí)慣和代碼能力;
3,掌握深度學(xué)習(xí)基礎(chǔ)理論,熟悉CNN、Transformer等主干網(wǎng)絡(luò)架構(gòu)原理(卷積操作、注意力機(jī)制、FPN/PAN特征融合等核心概念);
4,熟練使用OpenCV進(jìn)行圖像處理與分析,具備扎實(shí)的傳統(tǒng)視覺算法功底;
5,對(duì)YOLO系列檢測(cè)框架有深入理解和實(shí)際項(xiàng)目經(jīng)驗(yàn),熟悉Anchor-Free/Anchor-Based檢測(cè)范式、NMS后處理、多尺度檢測(cè)等關(guān)鍵技術(shù);
6,對(duì)視覺大模型(VLM)架構(gòu)有了解或?qū)嵺`經(jīng)驗(yàn),理解視覺編碼器(ViT、SigLIP等)的工作原理,了解視覺Token化、圖像分辨率適配(Dynamic Resolution、AnyRes等)策略者優(yōu)先;
7,熟悉PyTorch等主流深度學(xué)習(xí)框架,有MMDetection、Ultralytics、Detectron2等檢測(cè)工具鏈?zhǔn)褂媒?jīng)驗(yàn)者優(yōu)先;
8,具備良好的文獻(xiàn)閱讀能力和自驅(qū)學(xué)習(xí)習(xí)慣,能夠快速理解并復(fù)現(xiàn)前沿工作;
9,有天池競賽、CVPR/ECCV/ICCV等頂會(huì)論文發(fā)表、開源項(xiàng)目貢獻(xiàn)經(jīng)驗(yàn)者優(yōu)先。
加分項(xiàng):
1,有模型部署實(shí)戰(zhàn)經(jīng)驗(yàn)(TensorRT、ONNX、TFLite等),熟悉從訓(xùn)練到上線的完整鏈路
2,有多模態(tài)大模型相關(guān)研究或項(xiàng)目經(jīng)驗(yàn)(如Qwen-VL、InternVL、LLaVA等模型的訓(xùn)練或微調(diào))
3,有實(shí)際視覺應(yīng)用落地經(jīng)驗(yàn)(如工業(yè)質(zhì)檢、自動(dòng)駕駛感知、安防監(jiān)控等場(chǎng)景)