工作內(nèi)容:1.使用或重構(gòu) LangGraph / LangChain 架構(gòu),打造可擴(kuò)展的多 Agent 系統(tǒng)。
2.構(gòu)建核心模塊(如 Tool 調(diào)用、人類反饋接口、Memory、StateGraph、Supervisor、Planner 等)
3.設(shè)計(jì)并落地嵌套調(diào)用、流式輸出、異常重試的 Agent 執(zhí)行流
4.構(gòu)建高性能 API 服務(wù),與外部系統(tǒng)互通(FastAPI / WebSocket / Redis / TaskQueue)
5.集成向量數(shù)據(jù)庫(kù)與 RAG 檢索系統(tǒng),支撐智能問答與長(zhǎng)記憶能力
將這些模塊真正打磨成 可跑、可用、可上線、有用戶的產(chǎn)品
技術(shù)要求:
1.Agent 架構(gòu)理解力熟悉 LangGraph、LCEL、Autogen、CrewAI 等框架
2.理解 Memory / Tool / Planner / Router / Loop / 狀態(tài)管理機(jī)制
3.能獨(dú)立設(shè)計(jì)執(zhí)行鏈路,調(diào)試鏈?zhǔn)秸{(diào)用、多 Agent 分工等復(fù)雜行為
4.扎實(shí)的 Python 能力FastAPI / Flask / WebSocket / Redis 的實(shí)戰(zhàn)經(jīng)驗(yàn)
5.熟悉異步調(diào)度、事件驅(qū)動(dòng)架構(gòu)、緩存系統(tǒng)等系統(tǒng)模塊數(shù)據(jù)檢索與語(yǔ)義理解
6.熟悉向量數(shù)據(jù)庫(kù)的部署與使用(如 FAISS / Qdrant / Pinecone / Weaviate)
7.理解 Embedding、Chunking、RAG Pipeline、Semantic Search
8.能根據(jù)產(chǎn)品需求優(yōu)化搜索精度與召回率
9.模型推理部署(加分項(xiàng))
10.使用過 Replicate / TorchServe / Modal / RunPod / Docker / HuggingFace Spaces
11.能將大模型封裝成服務(wù)接口并部署;熟悉模型緩存、流式輸出、LoRA 微調(diào)機(jī)制(非強(qiáng)制)