崗位職責(zé)
1. 基于業(yè)務(wù)場景開展數(shù)據(jù)挖掘與建模工作,包括數(shù)據(jù)探索、特征工程、算法選型與模型訓(xùn)練、優(yōu)化及落地部署,解決核心業(yè)務(wù)問題;
2. 負責(zé)海量數(shù)據(jù)的清洗、預(yù)處理與特征提取,運用統(tǒng)計學(xué)、機器學(xué)習(xí)方法構(gòu)建用戶畫像、推薦系統(tǒng)、風(fēng)險預(yù)測等核心模型;
3. 參與大數(shù)據(jù)平臺數(shù)據(jù)挖掘相關(guān)工具與流程的優(yōu)化,提升數(shù)據(jù)處理與模型迭代效率,支撐業(yè)務(wù)數(shù)據(jù)驅(qū)動決策;
4. 與產(chǎn)品、業(yè)務(wù)、技術(shù)團隊緊密協(xié)作,理解業(yè)務(wù)需求并轉(zhuǎn)化為數(shù)據(jù)挖掘方案,提供模型效果評估與業(yè)務(wù)落地建議;
5. 跟蹤行業(yè)前沿算法與技術(shù)趨勢(如深度學(xué)習(xí)、圖計算),引入合適的技術(shù)方法優(yōu)化現(xiàn)有模型效果與工程化能力。
任職要求
1. 本科及以上學(xué)歷,數(shù)學(xué)、統(tǒng)計學(xué)、計算機、大數(shù)據(jù)、人工智能等相關(guān)專業(yè),3年以上數(shù)據(jù)挖掘/機器學(xué)習(xí)實戰(zhàn)經(jīng)驗;
2. 精通Python/R語言,熟練使用Scikit-learn、TensorFlow、PyTorch等機器學(xué)習(xí)/深度學(xué)習(xí)框架,具備獨立建模與調(diào)優(yōu)能力;
3. 熟練掌握Hadoop、Hive等大數(shù)據(jù)生態(tài)組件,能高效處理海量結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù),熟悉Spark SQL、Pandas、NumPy等數(shù)據(jù)處理工具;
4. 扎實的統(tǒng)計學(xué)與機器學(xué)習(xí)理論基礎(chǔ),深入理解常見算法(回歸、分類、聚類、推薦、深度學(xué)習(xí))的原理與應(yīng)用場景,能解決實際業(yè)務(wù)中的過擬合、數(shù)據(jù)稀疏等問題;
5. 具備良好的業(yè)務(wù)理解能力、邏輯思維與問題解決能力,有大型互聯(lián)網(wǎng)、金融或企業(yè)級數(shù)據(jù)挖掘項目落地經(jīng)驗者優(yōu)先;
6. 熟悉數(shù)據(jù)倉庫設(shè)計理念、特征平臺搭建或模型工程化部署(如TensorFlow Serving、MLflow)者優(yōu)先,具備良好的溝通協(xié)作與文檔撰寫能力。