国产精品又长又粗又爽又黄的毛片, 国产AV无码专区亚洲AV毛片搜, 丰满人妻被猛烈进入中文字幕四川, 国产精品一区二区三区国产女人喷,亚洲国产欧美日韩图片在线人,潘娇娇337p人艺体艺术,成人免费无码大片a毛片古装,一本到高清视频免费,人妻在线视频免费看

更新于 今天

杭州-CCIE 專家(急聘)

3-4.5萬
  • 杭州西湖區(qū)
  • 經(jīng)驗(yàn)不限
  • 碩士
  • 全職
  • 招1人

職位描述

CCIE
(一)崗位職責(zé)
1、硬件部署與集成:基于售前頂層設(shè)計(jì)方案與項(xiàng)目合同,主導(dǎo)制定行業(yè)領(lǐng)先的交付實(shí)施計(jì)劃(含風(fēng)險(xiǎn)預(yù)判模型與資源最優(yōu)配置方案)。牽頭超大規(guī)模智算中心(萬卡級)基礎(chǔ)設(shè)施部署與集成,獨(dú)立統(tǒng)籌算力集群、高速 RDMA 網(wǎng)絡(luò)、全閃存存儲(chǔ)系統(tǒng)、高密度制冷與冗余供電等核心設(shè)施的現(xiàn)場實(shí)施,主導(dǎo)跨廠商硬件兼容性測試、系統(tǒng)聯(lián)調(diào)與集成驗(yàn)證。
2、軟件配置與優(yōu)化:負(fù)責(zé)定制化智算平臺(tái)軟件與調(diào)度系統(tǒng)的架構(gòu)搭建、部署配置,主導(dǎo)完成操作系統(tǒng)內(nèi)核優(yōu)化、容器平臺(tái)(K8s)高可用集群搭建、高性能作業(yè)調(diào)度系統(tǒng)(如 Slurm/LSF)定制開發(fā)、分布式存儲(chǔ)(如 Ceph)性能調(diào)優(yōu)、AI 框架(TensorFlow/PyTorch)適配優(yōu)化。
3、性能調(diào)優(yōu)與穩(wěn)定性保障:構(gòu)建智算系統(tǒng)全維度性能測試體系(含算力、網(wǎng)絡(luò)帶寬 / 延遲、存儲(chǔ) IOPS / 吞吐量等核心指標(biāo)),運(yùn)用專業(yè)工具(如 Perf、NVIDIA DCGM)進(jìn)行深度瓶頸分析,主導(dǎo)制定并落地針對性調(diào)優(yōu)方案(如 GPU 集群通信優(yōu)化、存儲(chǔ)分級緩存策略調(diào)整),確保系統(tǒng)性能超越設(shè)計(jì)指標(biāo) 10%-15% ,且 7×24 小時(shí)穩(wěn)定運(yùn)行率達(dá) 99.99%。
4、問題解決與協(xié)調(diào):作為技術(shù)核心,快速響應(yīng)并牽頭解決部署、聯(lián)調(diào)及試運(yùn)行階段的重大技術(shù)難題(如跨架構(gòu)硬件兼容性故障、大規(guī)模集群網(wǎng)絡(luò)擁塞、軟件棧深度適配問題),統(tǒng)籌協(xié)調(diào)內(nèi)外部頂級技術(shù)資源(如廠商專家、高??蒲袌F(tuán)隊(duì))進(jìn)行根因分析。
5、項(xiàng)目交付支撐:主導(dǎo)構(gòu)建標(biāo)準(zhǔn)化交付文檔體系,輸出具備行業(yè)參考價(jià)值的實(shí)施計(jì)劃、部署圖紙、配置清單、測試報(bào)告(含性能對比分析)、運(yùn)維手冊(含故障應(yīng)急響應(yīng)流程)及培訓(xùn)資料,牽頭完成客戶運(yùn)維團(tuán)隊(duì)的體系化技術(shù)培訓(xùn)。
(二)任職要求
1、教育背景:通信工程、電子信息工程、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程等相關(guān)專業(yè),985碩士研究生及以上學(xué)歷優(yōu)先。
2、工作經(jīng)驗(yàn):具備智算中心、超算中心或大型數(shù)據(jù)中心項(xiàng)目交付、系統(tǒng)集成實(shí)際操作經(jīng)驗(yàn)。主導(dǎo)過至少1 個(gè)從零到一建設(shè)的萬卡級及以上智算集群交付項(xiàng)目(需含 GPU/NPU 混合架構(gòu)),具備萬卡級集群大模型訓(xùn)練,微調(diào),推理的參數(shù)面優(yōu)化經(jīng)驗(yàn)。有國家級 / 省級重點(diǎn)智算項(xiàng)目(如政務(wù)智算中心、AI 大模型訓(xùn)練集群)核心交付經(jīng)驗(yàn)者優(yōu)先。具備互聯(lián)網(wǎng)大廠工作經(jīng)驗(yàn)優(yōu)先。
3、網(wǎng)絡(luò)技術(shù):精通數(shù)通網(wǎng)絡(luò)理論與實(shí)踐,深入掌握 TCP/IP、HTTP、RoCEv2、IB 等協(xié)議原理及優(yōu)化方案,能獨(dú)立完成超大規(guī)模智算中心網(wǎng)絡(luò)架構(gòu)(含 Spine-Leaf 拓?fù)?、RDMA 網(wǎng)絡(luò))的規(guī)劃與設(shè)計(jì);熟練使用 Python/Ansible 編寫數(shù)據(jù)中心級交換機(jī)自動(dòng)化部署腳本,具備萬兆 / 四十萬兆網(wǎng)絡(luò)獨(dú)立調(diào)試、全網(wǎng)聯(lián)合調(diào)試及故障定位能力,曾主導(dǎo)解決過大規(guī)模集群網(wǎng)絡(luò)擁塞、延遲超標(biāo)等核心問題。
4、硬件知識(shí):精通 X86/ARM 架構(gòu)服務(wù)器(如華為 TaiShan、浪潮 NF 系列)、SAN 存儲(chǔ)(如 EMC VMAX)、分布式存儲(chǔ)(如 Ceph、GlusterFS)技術(shù)原理與部署優(yōu)化;深入掌握主流算力廠商(NVIDIA、華為昇騰、寒武紀(jì))GPU/NPU 產(chǎn)品技術(shù)細(xì)節(jié)(如算力卡型號差異、集群互聯(lián)方案),能獨(dú)立評估并選型適配不同業(yè)務(wù)場景的硬件解決方案,曾主導(dǎo)過跨廠商硬件混合部署的技術(shù)攻堅(jiān)。
5、軟件與平臺(tái):精通 Windows Server、Linux Server(CentOS/Ubuntu/RedHat)系統(tǒng)運(yùn)維與內(nèi)核優(yōu)化;熟練使用 Shell/Python(需具備至少 1 個(gè)自主開發(fā)的運(yùn)維工具或自動(dòng)化腳本項(xiàng)目經(jīng)驗(yàn))。精通 OpenStack 云平臺(tái)(含 Nova、Neutron、Cinder 模塊)、Docker/K8s 容器技術(shù)的部署、調(diào)優(yōu)與故障排查,熟悉大模型訓(xùn)練推理的分布式計(jì)算框架,具備大規(guī)模容器集群(千節(jié)點(diǎn)級)運(yùn)維經(jīng)驗(yàn)。熟悉 AI 框架(TensorFlow/PyTorch/MindSpore)部署與優(yōu)化,有 AI 訓(xùn)練任務(wù)調(diào)度效率提升項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
6、認(rèn)證證書:持有HCIE-Data Center/Cloud/Storage、CCIE Data Center 、RHCE/RHCA、NVIDIA DCAT 等專業(yè)認(rèn)證優(yōu)先;有云計(jì)算、AI 算力相關(guān)專利或核心技術(shù)論文(第一作者)者優(yōu)先。

工作地點(diǎn)

杭州西湖區(qū)武林門

職位發(fā)布者

郭女士/人事主管

昨日活躍
立即溝通
公司Logo北京卡利歐瑪能源管理有限公司
公司主頁