職位描述
職位描述
1. 負責多模態(tài)文檔解析模型的訓練、調(diào)優(yōu)、評測和部署;
2. 研究業(yè)務(wù)場景中版面分析、表格解析、全文解析的實現(xiàn)及優(yōu)化,助力多模態(tài)大模型(LMM)在金融文檔解析和信息抽取上落地;
3. 跟蹤最新的 LMM 及人工智能領(lǐng)域進展,持續(xù)進行新技術(shù)迭代;
4. 進行文檔場景、多模態(tài)場景相關(guān)的數(shù)據(jù)采集、清洗和制備。
職位要求
1. 本科及以上學歷,計算機科學、數(shù)學、統(tǒng)計學等相關(guān)專業(yè)優(yōu)先;
2. 具備扎實的 Python 編程能力,熟悉至少一種深度學習框架,能夠在較短時間內(nèi)理解源碼,代碼書寫規(guī)范,具有良好的編程能力和扎實的數(shù)學理論基礎(chǔ);
3. 具備OCR、文檔解析和多模態(tài)相關(guān)經(jīng)驗,熟悉 Qwen2.5-VL、GOT-OCR2.0等模型,有多模態(tài)大模型(LMM)相關(guān)經(jīng)驗者優(yōu)先;
4. 熟練掌握 Linux 常用命令,熟悉Vim、Git 工具;
5. 有良好的文檔書寫習慣,能夠編寫規(guī)范化的技術(shù)文檔;
6. 表達清晰,溝通順暢,具備良好的團隊協(xié)作和溝通能力;
7. 熟悉多模態(tài)方向的最新技術(shù)進展,關(guān)注行業(yè)前沿,對技術(shù)開發(fā)及應用有熱情,有自己的想法并樂于挑戰(zhàn)自我