一、崗位職責
1.大數(shù)據(jù)平臺運維管理:制定大數(shù)據(jù)平臺運維管理規(guī)定、軟硬件變更方案和實施,改造方案和實施。
2.需求管理:梳理核電業(yè)務需求;挖掘數(shù)據(jù)場景;編制需求規(guī)格說明書及設計方案。
3.數(shù)據(jù)管控及治理:制定公司數(shù)據(jù)標準和規(guī)范;建立公司數(shù)據(jù)質量管控流程,數(shù)據(jù)資產(chǎn)消費管控流程;開展主數(shù)據(jù)和元數(shù)據(jù)的管理;開展大數(shù)據(jù)安全審計。
4.大數(shù)據(jù)應用程序開發(fā):開發(fā)大數(shù)據(jù)應用程序,包括數(shù)據(jù)挖掘、機器學習等;進行數(shù)據(jù)可視化和數(shù)據(jù)交互分析,面向用戶交互。
二、任職資格
1.本科及以上學歷,計算機、通信、電子信息、軟件工程等相關專業(yè);四年及以上計算機信息相關工作經(jīng)驗。
2.熟練開展大數(shù)據(jù)挖掘基礎算法的開發(fā),MLlib 機器學習開發(fā),深度學習的人工神經(jīng)網(wǎng)絡的開發(fā);熟練使用Python語言及相關工具實現(xiàn)模型建立、算開發(fā)、BI展示等業(yè)務應用開發(fā)。
3.掌握Hadoop大數(shù)據(jù)生態(tài)集群的部署與工作原理,包括大數(shù)據(jù)管理框架Zookeeper、YARN、Docker分布式集群的構建,資源管控與穩(wěn)定運維。理解大數(shù)據(jù)存儲框架HDFS、HBase、NoSQL的技術原理,掌握大數(shù)據(jù)的計算框架MapReduce、Hive、Spark、ESearch的運用;
4.掌握大數(shù)據(jù)分析理論、工具和方法,如噪聲過濾、數(shù)據(jù)屬性填補、屬性值歸一化、數(shù)據(jù)去重等,進而開展大數(shù)據(jù)分類與建模,實現(xiàn)智能決策,精準預判;
5.掌握軟件運維系統(tǒng)運維業(yè)務管理流程、資產(chǎn)管理體系、質量管理體系、運維安全管理要求、文件管理體系。