崗位職責(zé):
核心職責(zé) (聚焦Python開發(fā),支撐算法模型)
1.Python數(shù)據(jù)處理模塊開發(fā):
?使用 Python 開發(fā)可復(fù)用、可維護的數(shù)據(jù)清洗、轉(zhuǎn)換、特征處理模塊/函數(shù)/工具包。
?利用 Pandas, NumPy 等庫高效處理結(jié)構(gòu)化/半結(jié)構(gòu)化數(shù)據(jù),解決實際業(yè)務(wù)場景中的數(shù)據(jù)問題。
?優(yōu)化現(xiàn)有Python數(shù)據(jù)處理腳本的性能(速度、內(nèi)存效率)。
2.數(shù)據(jù)處理管道構(gòu)建與集成:
?參與設(shè)計和實現(xiàn)基于Python的數(shù)據(jù)預(yù)處理流水線,確保其模塊化、可配置、易擴展。
?將開發(fā)的數(shù)據(jù)處理模塊集成到模型訓(xùn)練、評估或部署的自動化流程中。
?編寫清晰易懂的API或工具接口,供算法工程師或下游系統(tǒng)調(diào)用。
3.數(shù)據(jù)集構(gòu)建與管理 (Python實現(xiàn)):
?開發(fā)Python腳本進行數(shù)據(jù)集的自動化拆分(訓(xùn)練/驗證/測試集)、采樣、版本管理。
?實現(xiàn)或維護數(shù)據(jù)集的加載、緩存機制,提升模型訓(xùn)練效率。
4.模型支持?jǐn)?shù)據(jù)工程:
?開發(fā)工具/腳本處理模型預(yù)測結(jié)果,進行基礎(chǔ)統(tǒng)計、格式化或持久化。
?構(gòu)建Python工具收集、匯總模型評估所需的指標(biāo)數(shù)據(jù)。
任職要求 (Python為核心)
1.教育背景:
?計算機科學(xué)、軟件工程、數(shù)據(jù)科學(xué)或相關(guān)專業(yè)的本科或研究生。
2.核心技能與知識 (Python工程能力是重點):
?精通Python編程: 扎實的Python語言基礎(chǔ)(OOP, 常用數(shù)據(jù)結(jié)構(gòu),函數(shù)式編程概念),這是核心要求。有≥2個使用Python完成的項目經(jīng)驗(課程項目、個人項目、競賽等)。
?Python數(shù)據(jù)處理庫精通: 熟練掌握 Pandas 進行復(fù)雜數(shù)據(jù)操作(索引、分組聚合、合并、透視表、高效處理缺失值/異常值等)。熟悉 NumPy 進行數(shù)組操作和數(shù)值計算。
2.工程化思維:
?理解模塊化、可復(fù)用性、可維護性的代碼設(shè)計原則。
?了解基礎(chǔ)的軟件測試概念(單元測試、集成測試)
?熟悉版本控制工具 (分支管理、Pull Request流程)。
?基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)與算法: 了解常見數(shù)據(jù)結(jié)構(gòu)(列表、字典、集合)和算法(排序、搜索)的時間/空間復(fù)雜度。
?操作系統(tǒng)與環(huán)境: 熟悉Linux命令行操作,能配置Python虛擬環(huán)境(如venv, conda),管理依賴。
3.對算法模型的理解與應(yīng)用場景:
?基本概念: 了解機器學(xué)習(xí)的基本流程(數(shù)據(jù)->特征->模型->評估)和常見任務(wù)(分類、回歸)。了解常用評估指標(biāo)(準(zhǔn)確率、召回率、AUC等)的含義。
?興趣驅(qū)動: 對人工智能領(lǐng)域有濃厚興趣,渴望了解模型背后的數(shù)據(jù)工程挑戰(zhàn)。
4.軟技能:
?極強的學(xué)習(xí)能力與主動性: 能快速學(xué)習(xí)新技術(shù)并應(yīng)用于實踐。
?嚴(yán)謹(jǐn)細(xì)致: 對代碼質(zhì)量和數(shù)據(jù)準(zhǔn)確性有高要求,注重細(xì)節(jié)。
?良好的溝通協(xié)作: 能清晰表達(dá)技術(shù)問題和解決方案,積極融入團隊。
?解決問題能力: 具備獨立調(diào)試代碼、分析解決技術(shù)問題的能力。
?責(zé)任心與自驅(qū)力: 能按時交付高質(zhì)量的工作成果。