##崗位職責:
1.負責公司采集平臺(數(shù)據(jù)采集/調(diào)度/管理等模塊)的需求分析、架構(gòu)設計、功能開發(fā)與持續(xù)維護優(yōu)化。
2.負責部分 Java 采集/爬取相關(guān)程序的設計、開發(fā)、性能調(diào)優(yōu)與問題排查。
3.參與分布式服務的設計與部署,提升系統(tǒng)的穩(wěn)定性、擴展性與高可用能力,。
4.優(yōu)化采集鏈路的調(diào)度策略、任務容錯、隊列管理、數(shù)據(jù)清洗與異常監(jiān)控。
5.編寫并維護高質(zhì)量的技術(shù)文檔、接口說明、設計文檔與運維手冊。
##任職要求:
1.本科及以上學歷,計算機相關(guān)專業(yè),3 年及以上 Java 后端開發(fā)經(jīng)驗。
2.熟悉分布式系統(tǒng)的設計與開發(fā),具備服務拆分、注冊發(fā)現(xiàn)、配置管理、負載均衡等實踐經(jīng)驗,。
3.熟練掌握 Spring Boot/Spring Cloud 生態(tài),熟悉 Nacos(配置中心/注冊中心)等常用組件。
4.具備爬蟲或調(diào)度類系統(tǒng)(任務調(diào)度、分布式執(zhí)行、去重、限速、重試、監(jiān)控)實際項目經(jīng)驗。
5.有完整的爬蟲系統(tǒng)開發(fā)經(jīng)驗(如采集框架選型、反爬策略、代理池、抓取效率優(yōu)化、數(shù)據(jù)清洗與存儲)。
6.熟悉常用中間件(如 Redis、Kafka、RabbitMQ、Elasticsearch、MySQL 等),能進行性能調(diào)優(yōu)與問題定位。
7.具備良好的代碼規(guī)范、單元測試意識與性能監(jiān)控、日志排障經(jīng)驗。
8.思路清晰,責任心強,具備良好的溝通協(xié)作能力與自驅(qū)力。
9.能夠使用AI輔助編碼,,了解常用的如Cursor等IDE工具。
## 加分項
1.熟練掌握 Python 開發(fā),能編寫高質(zhì)量的 Python 爬蟲/調(diào)度腳本或輔助工具。
2.了解常見爬蟲框架(Scrapy、Playwright、Selenium、Colly 等)或分布式爬蟲架構(gòu)實踐。
3.有大規(guī)模任務調(diào)度平臺(如 Airfow、XXL-JOB、Flink、Kettle 等)二次開發(fā)或深度使用經(jīng)驗。