崗位職責(zé):
1.負(fù)責(zé)數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與分層開發(fā),基于業(yè)務(wù)需求搭建 ODS、DWD、DWS、ADS 分層模型,制定并落地?cái)?shù)據(jù)倉(cāng)庫(kù)命名規(guī)范、開發(fā)規(guī)范。
2.基于 Apache Doris、ClickHouse 等大數(shù)據(jù)引擎,編寫高效的 SQL 腳本,完成數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、加載(ETL) 任務(wù),保障數(shù)據(jù)同步的準(zhǔn)確性和時(shí)效性。
3.負(fù)責(zé)DataX、Sqoop等數(shù)據(jù)同步工具的任務(wù)配置、調(diào)度與監(jiān)控,解決數(shù)據(jù)同步過程中的斷點(diǎn)續(xù)傳、數(shù)據(jù)一致性等問題。
4.參與大數(shù)據(jù)平臺(tái)性能優(yōu)化,包括 SQL 語(yǔ)句優(yōu)化、分區(qū)裁剪、謂詞下推、索引設(shè)計(jì)等,提升數(shù)據(jù)查詢和處理效率。
5.配合業(yè)務(wù)部門進(jìn)行數(shù)據(jù)需求調(diào)研與分析,提供數(shù)據(jù)支撐方案,輸出符合業(yè)務(wù)需求的報(bào)表、指標(biāo)體系或數(shù)據(jù)接口。
6.負(fù)責(zé)數(shù)據(jù)任務(wù)的監(jiān)控與運(yùn)維,建立數(shù)據(jù)質(zhì)量校驗(yàn)規(guī)則,及時(shí)排查和解決數(shù)據(jù)延遲、數(shù)據(jù)錯(cuò)誤等問題,保障數(shù)據(jù)鏈路穩(wěn)定運(yùn)行。
任職要求:
硬性要求:
1.本科及以上學(xué)歷,計(jì)算機(jī)、軟件工程、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè),3 年及以上大數(shù)據(jù)開發(fā)相關(guān)工作經(jīng)驗(yàn)。
2.精通 Hadoop 生態(tài)體系,熟練掌握 HDFS、YARN、MapReduce、Hive、Spark 等核心組件的原理與應(yīng)用。
3.熟練使用 Apache Doris、ClickHouse 至少一種 MPP 數(shù)據(jù)庫(kù),具備豐富的表結(jié)構(gòu)設(shè)計(jì)、SQL 優(yōu)化經(jīng)驗(yàn),理解 CBO 優(yōu)化器原理。
4.熟練使用 DataX 等數(shù)據(jù)同步工具,能夠獨(dú)立配置復(fù)雜的數(shù)據(jù)同步任務(wù),解決異構(gòu)數(shù)據(jù)源同步問題。
5.掌握 Shell/Python 腳本開發(fā),能夠編寫自動(dòng)化調(diào)度腳本、數(shù)據(jù)校驗(yàn)?zāi)_本。
6.具備SmartBI、FINEBI等至少一個(gè)主流BI產(chǎn)品的建設(shè)經(jīng)驗(yàn)優(yōu)先
7.了解主流調(diào)度工具的使用,能夠搭建完整的 ETL 調(diào)度流程。
軟性要求:
1.具備較強(qiáng)的邏輯思維能力,能夠快速拆解復(fù)雜業(yè)務(wù)需求并轉(zhuǎn)化為技術(shù)方案。
2.具備良好的問題排查能力,能夠定位并解決大數(shù)據(jù)平臺(tái)運(yùn)行過程中的性能瓶頸和數(shù)據(jù)異常問題。
3.具備團(tuán)隊(duì)協(xié)作精神,能夠與業(yè)務(wù)分析師、數(shù)據(jù)分析師高效溝通,推動(dòng)項(xiàng)目落地。
4.具備較強(qiáng)的學(xué)習(xí)能力,能夠快速跟進(jìn)新技術(shù)并應(yīng)用于實(shí)際工作。