崗位職責(zé)
1.視頻智能檢測與分析
●負(fù)責(zé)計算機視覺相關(guān)算法的研發(fā)和優(yōu)化,包括但不限于目標(biāo)檢測、圖像分割、圖像分類等方向。
●參與基于深度學(xué)習(xí)的目標(biāo)檢測模型(如YOLO系列)的開發(fā)、訓(xùn)練、調(diào)優(yōu)及部署。
●研發(fā)視頻理解模型,實現(xiàn)行為識別、異常事件檢測、場景語義理解、視頻摘要生成等任務(wù)。
2生成式AI開發(fā)與內(nèi)容生成
●研發(fā)多模態(tài)生成式模型(文本/圖像/視頻生成),優(yōu)化生成內(nèi)容的多樣性、可控性與合規(guī)性。
●開發(fā)基于大模型的AIGC工具鏈,支持營銷素材、教育課件、影視腳本等內(nèi)容的自動化生成。
3.AI生成結(jié)構(gòu)化報表系統(tǒng)
●構(gòu)建基于大模型的自動化報表生成系統(tǒng),支持從多源數(shù)據(jù)(數(shù)據(jù)庫、日志、圖表)到結(jié)構(gòu)化報告(文本+可視化圖表)的端到端生成。
●開發(fā)動態(tài)交互式報表系統(tǒng),支持用戶自然語言查詢與報告內(nèi)容實時更新。
4.智能體(Agent)系統(tǒng)開發(fā)
●構(gòu)建基于大模型的自主智能體(如AutoGPT、MetaGPT),支持多工具調(diào)用(API、數(shù)據(jù)庫)、任務(wù)規(guī)劃與環(huán)境交互。
●設(shè)計智能體協(xié)作框架,實現(xiàn)多智能體間的競爭、協(xié)同與長期目標(biāo)推理。
技術(shù)能力要求
深入掌握以下至少兩個方向技術(shù):
1. 目標(biāo)檢測與視頻動作分析
●精通Python,熟悉PyTorch/TensorFlow框架;開發(fā)優(yōu)化YOLO系列模型,實現(xiàn)高精度實時目標(biāo)檢測、工程服務(wù)的部署。
●開發(fā)行為識別模型(如TimeSformer、Video Swin Transformer),提升異常事件檢測精度。
2. 大模型知識庫與智能體
●掌握HuggingFace、LangChain、xinference等。構(gòu)建基于GPT/LLaMA的知識庫問答系統(tǒng),支持醫(yī)療健康領(lǐng)域智能咨詢。
●開發(fā)AutoGPT/MetaGPT智能體,實現(xiàn)多工具調(diào)用與任務(wù)規(guī)劃,應(yīng)用于自動化數(shù)據(jù)處理。
3. 生成式AI
● 研發(fā)多模態(tài)生成模型(如Stable Diffusion、Sora),優(yōu)化文本、圖像、視頻生成內(nèi)容的多樣性與可控性。
● 掌握LoRA、P-Tuning等微調(diào)技術(shù),提升生成模型在垂直領(lǐng)域(如醫(yī)療、教育)的表現(xiàn)。
加分項
●在生成式AI(ICLR、NeurIPS)、視頻理解(CVPR、ICCV)、智能體(AAMAS)等頂會發(fā)表論文或開源項目貢獻。
●有垂直領(lǐng)域(金融、醫(yī)療、工業(yè))自動化報表生成系統(tǒng)落地經(jīng)驗。
●熟悉多模態(tài)Agent框架(AutoGen、Microsoft Guidance)、或視頻生成技術(shù)(Runway ML、Pika)。
●掌握知識庫構(gòu)建、Agent開發(fā)等技術(shù),并有智能客服、智能營銷、運營等方面落地經(jīng)驗。