国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 8月18日

爬蟲工程師

1.2-1.3萬
  • 上海徐匯區(qū)
  • 1-3年
  • 本科
  • 全職
  • 招1人

雇員點評標簽

  • 工作環(huán)境好
  • 同事很nice
  • 人際關系好
  • 團隊執(zhí)行強
  • 氛圍活躍
  • 免費班車
  • 管理人性化
  • 準時發(fā)工資

職位描述

JavaScript數(shù)據(jù)挖掘數(shù)據(jù)清洗爬蟲開發(fā)反爬蟲分布式爬蟲Scrapy互聯(lián)網(wǎng)人工智能計算機軟件
針對外文語料數(shù)據(jù)采集工作,目前已經(jīng)對預訓練數(shù)據(jù)采集、全站數(shù)據(jù)采集或者文件文檔下載類的需求已經(jīng)開發(fā)了采集系統(tǒng)或者采集平臺進行需求覆蓋。但是由于需求種類多樣還有較多類型的采集需求(定向采集,數(shù)據(jù)字段高定,目標站點反爬比較嚴重等)數(shù)據(jù)系統(tǒng)與平臺無法進行覆蓋需求,需要鋪設較多開發(fā)人員進行單站點或者單需求進行數(shù)據(jù)采集研發(fā)工作。
崗位描述
1負責大模型相關數(shù)據(jù)采集,包括不限于海內(nèi)外文本,圖片,音視頻數(shù)據(jù);
2負責對目標網(wǎng)站或 APP進行反爬突破、協(xié)議破解和提取關鍵數(shù)據(jù);
3負責反爬蟲策略研究,代理、驗證碼識別等采集支撐服務建設;
4參與大規(guī)模數(shù)據(jù)處理流程的設計與開發(fā),包括但不限于數(shù)據(jù)采集、清洗、轉(zhuǎn)換、存儲等過程。
服務范圍與內(nèi)容
1服務目標
協(xié)助開展各類數(shù)據(jù)采集業(yè)務(包括但不限于預訓練數(shù)據(jù)采集、全站數(shù)據(jù)采集、文件文檔下載等),針對多樣化的需求種類,特別是定向采集、高定數(shù)據(jù)字段以及目標站點反爬嚴重等情況,提供定制化解決方案。具體包含但不限于以下內(nèi)容:
1.大模型相關數(shù)據(jù)采集
o海內(nèi)外文本、圖片、音視頻等數(shù)據(jù)采集
o保證數(shù)據(jù)多樣性及高質(zhì)量
2.反爬蟲策略研究與實施
o深度分析目標網(wǎng)站或 APP
o突破反爬措施(協(xié)議破解、代理使用、驗證碼識別等)
o提供反爬支撐服務建設
3.大規(guī)模數(shù)據(jù)處理流程設計與開發(fā)
o數(shù)據(jù)采集、清洗、轉(zhuǎn)換、存儲的全流程實現(xiàn)
o確保數(shù)據(jù)準確性與可用
1、本科及以上學歷,計算機相關專業(yè)
2、 1年以上數(shù)據(jù)采集工作經(jīng)驗
?核心技能
1、精通 JavaScript逆向工程
2、有主流站點 Web端大規(guī)模數(shù)據(jù)采集經(jīng)驗
3、具備多類型驗證碼處理能力:包括滑塊、點選、Google reCAPTCHA、旋轉(zhuǎn)驗證碼等
4、熟悉 APP脫殼、逆向、反編譯及自動化相關技術
5、具備 AST反混淆 JavaScript代碼及 JSVMP算法還原能力
?附加技能(優(yōu)先考慮):具有風控應對經(jīng)驗(如 Akamai并發(fā)、Cloudflare等反爬蟲策略處理經(jīng)驗)

工作地點

模速空間(SMC)-A區(qū)模速空間上海模速空間,上海徐匯區(qū)龍臺路180號。

職位發(fā)布者

崔婉/高級招聘顧問

剛剛活躍
立即溝通
公司Logo軟通動力信息技術(集團)股份有限公司公司標簽
軟通動力信息技術(集團)股份有限公司(以下簡稱“軟通動力”)是中國數(shù)字技術產(chǎn)品和服務創(chuàng)新領導企業(yè),致力于成為一家具有全球影響力的科技企業(yè),企業(yè)數(shù)字化轉(zhuǎn)型可信賴合作伙伴。公司2005年成立于北京,多年來始終堅持科技創(chuàng)新,具有軟硬全棧的智能技術產(chǎn)品和服務能力,提供軟件與數(shù)字技術服務、計算產(chǎn)品與數(shù)字基礎設施、數(shù)字能源與智算服務以及國際化服務。目前,公司在10余個重要行業(yè)服務超過1100家國內(nèi)外客戶,其中超過230家客戶為世界500強或中國500強企業(yè),員工近90000人。軟通動力擁有軟通咨詢、軟通金科、軟通工業(yè)互聯(lián)、機械革命、軟通華方等業(yè)務子品牌,并在全球40余個城市布局業(yè)務,構建北美、日本、東南亞、中東四大國際交付中心,在北京城市副中心、江蘇無錫建設兩大智能制造基地。同時,公司前瞻布局智能制造、ICT軟硬基礎能力和生產(chǎn)力智能化產(chǎn)品,打造產(chǎn)業(yè)鏈閉環(huán)。軟通動力設立30個能力中心,擁有1個國家級工程實驗室,6個省市政府認定的工程、技術實驗室及研發(fā)中心,1個博士后科研工作站,50+技術合作伙伴的生態(tài)合作體系,不斷探索前沿技術的巨大商業(yè)應用潛力。公司旗下教育品牌軟通教育,擁有一家全日制本科學院——鄭州西亞斯學院數(shù)字技術產(chǎn)業(yè)學院;同時在全國合作院校600多所,設有70多個校企聯(lián)合人才培養(yǎng)基地,通過校企合作、協(xié)同育人,為社會培養(yǎng)高素質(zhì)應用型人才。軟通動力先后獲得“2023年中國IT服務市場排名TOP 1”、“2024年Q4 PC出貨量國內(nèi)市場份額排名TOP 2”、“2024年中國軟件和信息技術服務競爭力百強企業(yè)”、“2023年中國信創(chuàng)企業(yè)100強”、“2024萬得ESG評級(Wind ESG Rating)AA級及信息技術服務行業(yè)ESG綜合得分排名第一”等榮譽及市場認可,并擁有全球軟件工程領域最高級別CMMI V2.0成熟度5級評估認證、國家研發(fā)運營一體化(DevOps)三級能力成熟度模型認證、信息技術服務標準(ITSS)運維能力成熟度一級認證等專業(yè)資質(zhì),支撐公司更優(yōu)質(zhì)的服務體系。
公司主頁