崗位職責(zé):
1. 高難度數(shù)據(jù)采集:負(fù)責(zé)核心業(yè)務(wù)線網(wǎng)頁端及APP端公開數(shù)據(jù)采集,主導(dǎo)設(shè)計(jì)和實(shí)現(xiàn)高可用、可擴(kuò)展的分布式爬蟲架構(gòu)。
2. 逆向工程攻堅(jiān):針對(duì)頭部互聯(lián)網(wǎng)APP(如美團(tuán)、抖音、微信、滴滴等)進(jìn)行深度逆向分析,獨(dú)立破解其客戶端加密協(xié)議、復(fù)雜簽名算法(Signature/Token)及代碼混淆機(jī)制。
3. 動(dòng)態(tài)調(diào)試與破解:實(shí)戰(zhàn)應(yīng)用Frida、IDA Pro等工具鏈,對(duì)SO層(ARM/ARM64指令集)的混淆、VMP(Virtual Machine Protection)加固進(jìn)行動(dòng)態(tài)調(diào)試、脫殼與算法還原。有Unidbg模擬執(zhí)行經(jīng)驗(yàn)者優(yōu)先。
4. 風(fēng)控策略突破:設(shè)計(jì)并實(shí)現(xiàn)高仿真度的用戶行為模擬方案,攻克主流平臺(tái)的設(shè)備指紋、行為軌跡、人機(jī)識(shí)別等風(fēng)控體系,以支持秒殺、內(nèi)容抓取等關(guān)鍵場(chǎng)景。
5. 網(wǎng)絡(luò)協(xié)議分析:精通使用Wireshark、BurpSuite、Mitmproxy等工具,對(duì)TLS/HTTP2加密流量進(jìn)行解密、分析、攔截與腳本化重放,解決各類疑難抓包問題。
任職要求:
技術(shù)能力
● 精通 Python/Java 等編程語言,具備獨(dú)立完成爬蟲開發(fā)及維護(hù)的能力;
● 熟悉 Scrapy、Selenium、Requests 等主流爬蟲框架及工具;
● 深入理解 HTTP/TCP 協(xié)議,熟練使用 Fiddler、Wireshark 等抓包工具分析網(wǎng)絡(luò)請(qǐng)求;
● 掌握分布式爬蟲、代理 IP 池構(gòu)建、數(shù)據(jù)去重等進(jìn)階技術(shù)者優(yōu)先;
● 具備大數(shù)據(jù)量(TB 級(jí))處理經(jīng)驗(yàn)及性能優(yōu)化能力者優(yōu)先。
● 具備App逆向經(jīng)驗(yàn)者優(yōu)先
項(xiàng)目經(jīng)驗(yàn)
● 需提供 1-2 個(gè)完整爬蟲項(xiàng)目案例(需涵蓋網(wǎng)頁端或 App 端),需說明項(xiàng)目規(guī)模、技術(shù)難點(diǎn)及解決方案;
● 有電商、社交媒體、旅游等領(lǐng)域數(shù)據(jù)抓取經(jīng)驗(yàn)者優(yōu)先。