主要職責(zé):
1. 參與AI應(yīng)用的原型開發(fā)與迭代:在導(dǎo)師指導(dǎo)下,使用Python/Java等語言,參與基于大語言模型(LLM)或其他前沿AI模型的應(yīng)用功能模塊的設(shè)計(jì)、編碼和測試。
2. 探索與集成開源AI解決方案:主動(dòng)追蹤AI開源社區(qū)(如Model Scope, Hugging Face, Github等)的最新動(dòng)態(tài),評估、測試并嘗試將優(yōu)秀的開源模型和工具鏈集成到我們的系統(tǒng)中。
3. 數(shù)據(jù)處理與實(shí)驗(yàn):協(xié)助進(jìn)行模型訓(xùn)練和推理所需的數(shù)據(jù)清洗、預(yù)處理和增強(qiáng)工作,并參與算法模型的實(shí)驗(yàn)、評估及效果分析。
4. 技術(shù)文檔與分享:撰寫清晰的技術(shù)文檔,記錄實(shí)驗(yàn)過程和結(jié)果,并有機(jī)會(huì)在團(tuán)隊(duì)內(nèi)部分享你的發(fā)現(xiàn)和技術(shù)見解。
任職要求(必備條件):
1. 技術(shù)熱情與動(dòng)手能力:
對AI技術(shù)有強(qiáng)烈的好奇心和求知欲,有個(gè)人技術(shù)項(xiàng)目(如Github項(xiàng)目、技術(shù)博客、或任何你“搗鼓”出來的東西)是加分項(xiàng)。
習(xí)慣于主動(dòng)學(xué)習(xí)和解決技術(shù)難題,具備優(yōu)秀的快速學(xué)習(xí)能力。
2. AI實(shí)踐與開源生態(tài):
深度使用過大語言模型,對主流LLM(如GPT系列、Claude、LLaMA等)有實(shí)際使用經(jīng)驗(yàn),熟悉其Prompt工程和常見應(yīng)用模式。
將AI輔助編程作為日常習(xí)慣,熟練使用GitHub Copilot、Cursor、或類似AI編程工具來提升開發(fā)效率。
關(guān)注并嘗試過AI開源社區(qū)的項(xiàng)目,對Hugging Face等平臺有了解和使用經(jīng)驗(yàn)。
3. 扎實(shí)的算法基礎(chǔ):
熟練掌握常見的數(shù)據(jù)結(jié)構(gòu)(如數(shù)組、鏈表、樹、圖、哈希表)和算法(如排序、搜索、動(dòng)態(tài)規(guī)劃),具備良好的編程實(shí)現(xiàn)能力。
理解計(jì)算機(jī)系統(tǒng)的基礎(chǔ)知識,對時(shí)間復(fù)雜度、空間復(fù)雜度有清晰的概念。
4. 機(jī)器學(xué)習(xí)/深度學(xué)習(xí)基礎(chǔ):
熟悉機(jī)器學(xué)習(xí)的基本概念(如訓(xùn)練/測試集、過擬合、正則化、交叉驗(yàn)證)和常見模型(如線性模型、決策樹、SVM等)。
對深度學(xué)習(xí)有初步了解,理解神經(jīng)網(wǎng)絡(luò)的基本原理,熟悉CNN/RNN/Transformer中至少一種架構(gòu)的核心思想。
5. 編程語言:
至少精通Python或Java中的一門,并能夠編寫清晰、高效的代碼。
(Python方向)了解NumPy、Pandas等科學(xué)計(jì)算庫,以及PyTorch或TensorFlow之一。
(Java方向)了解常用的開發(fā)框架(如Spring Boot),并愿意學(xué)習(xí)Python及相關(guān)AI生態(tài)工具。
優(yōu)先考慮(具備以下任一方向經(jīng)驗(yàn)者):
1、視覺方向:
了解OpenCV、Pillow等圖像處理庫。
有使用主流CV框架(如MMDetection, Detectron2, PaddleCV)或圖像生成模型(如Stable Diffusion)。
2、籌劃與決策方向:
了解經(jīng)典路徑規(guī)劃算法(如A*、Dijkstra)或任務(wù)規(guī)劃技術(shù)。
對強(qiáng)化學(xué)習(xí)(RL)有基礎(chǔ)概念,或有相關(guān)框架(如OpenAI Gym, Ray RLlib)的使用經(jīng)驗(yàn)。
3、大模型應(yīng)用方向:
對RAG、Agent、模型微調(diào)(Fine-tuning)等技術(shù)領(lǐng)域有初步了解或?qū)嵺`。
接觸過向量數(shù)據(jù)庫、LangChain/LlamaIndex等LLM應(yīng)用開發(fā)框架。
4、通用能力:
有實(shí)際項(xiàng)目部署到線上環(huán)境(如使用云服務(wù))的經(jīng)歷。
在Kaggle、天池等算法競賽中取得過良好成績,或閱讀并復(fù)現(xiàn)過AI頂會(huì)論文的代碼。