jjzjj

基于DPU和HADOS-RACE加速Spark 3.x

背景简介ApacheSpark(下文简称Spark)是一种开源集群计算引擎,支持批/流计算、SQL分析、机器学习、图计算等计算范式,以其强大的容错能力、可扩展性、函数式API、多语言支持(SQL、Python、Java、Scala、R)等特性在大数据计算领域被广泛使用。其中,SparkSQL是Spark生态系统中的一个重要组件,它允许用户以结构化数据的方式进行数据处理,提供了强大的查询和分析功能。随着SSD和万兆网卡普及以及IO技术的提升,CPU计算逐渐成为Spark作业的瓶颈,而IO瓶颈则逐渐消失。有以下几个原因,首先,因为JVM提供的CPU指令级的优化如SIMD要远远少于其他Native语

了解一下CPU 、TPU、GPU、DPU、QPU

随着AI的火爆,CPU、TPU、GPU、DPU、QPU这些缩略词整天在各种媒体里面飞来飞去。本文主要解释这些处理器,以及他们的优缺点。CPU(中央处理器)CPU就像计算机的“大脑”。它能够处理计算机工作的所有基本任务,例如:运行程序、管理文件和执行基本计算。把它想象成一个人的大脑,确保你所有的能力和行为都正常。GPU(图形处理单元)GPU是计算机领域的“艺术家”。它被设计用来处理与图形和视觉处理相关的任务。当您玩视频游戏、观看视频或编辑照片和视频时,GPU会承担大部分繁重的工作,以使这些视觉效果看起来更好。这就像有一个专门的艺术家创造美丽的图像和动画。TPU(张量处理单元)TPU就像计算机世界

玩转云端 | 算力基础设施升级,看天翼云紫金DPU显身手!

 数字时代下,算力成为新的核心生产力,传统以CPU为核心的架构难以满足新场景下快速增长的算力需求,具备软硬加速能力的DPU得以出现并快速发展。天翼云凭借领先的技术和丰富的应用实践自研紫金DPU,打造为云而生的全新一代云计算体系结构,助力算力基础设施升级,赋能海量算力高效释放。传统数据中心里,所有的数据处理都依赖于CPU的通用计算能力,近10年来,数据带宽增长超过10倍,然而因为摩尔定律的失效,CPU的主频几乎没有增长,给算力基础设施的发展带来了极大挑战。云计算要实现虚拟化管理需要依托众多虚拟化和管理组件,这会大量占据服务器主机的CPU和内存资源,带来巨大的算力消耗,形成高额的算力税。然而即便如

dpu云主机网络性能问题排查记录

背景对基于DPU(MellanoxBF2)云主机产品进行网络性能摸底,发现小规格(2核4G内存1队列)的vmpps结果远低于预期,跟非DPU、同规格普通云主机对比,性能差至少一半环境、测试方案描述环境拓扑描述image.png=测试方法描述两台vm端到端通过内核版pktgen工具打流,通过sar观察tx和rx的ppsimage.png现象观察、统计了2个云主机,一个tx:49wpps,另一个rx:15wpps,且和普通云主机对比,性能差距明显image.png上图第三列是dpu云主机结果,第二列和第三列是不同性能的普通云主机普通云主机的性能:image.png阶段一初步排查思路-小规格vm性能

智能网卡相关知识(smart nic 、DPU)

网卡作为穿行在网络与计算之间的桥梁,是可以解决计算瓶颈的关键硬件。随着CPU密度和数据中心网络带宽的进一步提升,用户对预期性能的需求,系统运行平稳性都会有更高的要求。云厂商一方面面临巨大的成本压力,另一方面面临巨大的运维压力。而智能网卡的出现,可以用来减轻网络功能虚拟化的负担。目录一、智能网卡发展历程二、CPU/GPU/DPU关系和区别一、智能网卡发展历程(1)第一阶段:基础功能网卡        即普通网卡,能够提供2*10G带宽基本能力;硬件卸载能力较弱。        传统网卡在完成在完成数据收发工作外,不处理任何与云化、业务相关的计算任务。(2)第二阶段:硬件卸载网卡(第一代智能网卡S

天翼云加速落地紫金DPU实践应用,让算力供给更高效!

近日,以“智驱创新·芯动未来”为主题的第三届DPU峰会在北京成功举办。会上,天翼云凭借紫金DPU在架构革新、算力释放、场景落地等多方面的成果,荣膺“2023芯星品牌奖”,技术实力与品牌影响力再获行业认可。天翼云科技有限公司基础架构事业部高/级产品经理雷晓龙在技术生态论坛发表了题为“天翼云紫金DPU产品升级及应用实践”的演讲,分享天翼云以紫金DPU为核心的紫金架构,及其在多个算力应用场景中的探索实践,为业界提升计算系统效率、推动算力普惠应用提供了参考。构建高效算力基础设施打造新一代云计算体系架构当前,人工智能、大数据应用进入快速发展阶段,催生海量算力需求,拥有强大集群算力的新型数据中心成为突破人

现有网络设施集成SmartNIC / DPU的六大要求

长期以来,CPU一直被视为计算处理设备的支柱,GPU则用于处理实时图形。然而,近来备受瞩目的是数据处理单元——DPU。SmartNIC/DPU自20世纪80年代末以来,网络接口卡(NIC)取得了长足的发展。然而,尽管它们在当时是很先进的,但也仅限于两台计算机之间或本地网络上的简单连接。SmartNIC是可编程网卡,它涵盖了常规NIC之外的额外计算资源。SmartNIC的可编程资源可以由Arm内核、网络处理单元(NPU)和其他可编程单元组成。很多人将DPU视为SmartNIC发展的下一步。DPU是可编程设备,可以通过硬件加速来协助数据处理。SmartNIC则将服务器与网络有效连接,其可编程组件配

DPU — 功能特性 — 管理系统的硬件卸载

目录文章目录目录管理系统的硬件卸载OpenStack管理系统组件卸载Kubernetes管理系统组件卸载管理系统的硬件卸载云计算场景中,管理系统通常包括以下部分:云平台系统组件:构成云平台的底层支撑系统软件。运维系统组件:监控告警、日志审计系统软件。运营系统组件:业务运营系统软件。其中,针对云平台而言,目前主流的开源云平台为OpenStack和Kubernetes,所以需要分别进行讨论。OpenStack管理系统组件卸载OpenStack管理系统主要包含2种卸载场景:虚拟化管理系统:将OpenStack的ComputeNode中的nova-compute、neutron-agent、cinde

Xilinx Vitis AI量化部署Yolov5至DPU (PYNQ)

本文及后续更新都会放在个人主页~欢迎来看看https://lgyserver.top/index.php/2023/05/08/xilinx-vitis-ai%e9%87%8f%e5%8c%96%e9%83%a8%e7%bd%b2yolov5%e8%87%b3dpu-pynq/概要本文章记述了从YOLOv5源代码使用XilinxVitisAI进行量化并部署到DPU上的全流程。在开Pynq环境下运行测试通过。环境主机:Ubuntu22.04+Vivado2022.2+VitisAI2.5.0(使用Docker安装)+CUDA11.3开发板:XilinxKriaKV260+Pynq3.0+DPUP

快速认识DPU

DPU(DataProcessingUnit)是以数据为中心构造的专用处理器。那么为什么需要DPU?DPU主要承担什么功能?它带来什么影响?我们可以通过四个关键字快速认识DPU:数据中心、数据、卸载和重构。数据中心数据中心由大量的服务器构成。计算、存储、网络数据传输是数据中心的三大核心功能。在CPU之上运行操作系统、虚拟机管理器和Kubernetes等基础软件。在此之上业务应用部分通过虚拟机和容器进行部署,实现资源共享、弹性伸缩、多租户、微服务、SaaS等。底层由GPU、FPGA提供硬件加速,所有的加速资源、网络资源和存储资源由CPU统一协调调用。此时CPU不仅仅是控制的中心,也是数据流动的中