方案背景
随着数据量的爆炸性增长和云计算应用的日益复杂,传统的以 CPU 为核心的架构已难以满足云计算业务高性能、低成本、高安全性的数据处理需求。为了应对这些挑战,领先的云服务厂商纷纷将 DPU 集成到其云平台中,显著提升了云服务的性能、资源利用率、安全性和灵活性。然而,目前国内市场上公开、可商用的、基于DPU 的高性能云底座解决方案仍是一片空白,头部公有云服务提供商采用的方案都是高度定制化的,难以直接推广至其他企业及行业。
行业痛点
硬件资源消耗
“数据中心税”愈演愈烈,服务器超过25%的硬件资源用于网络、存储、管理、安全等辅助性工作负载,减少了实际业务应用可用的资源。
网络及存储效率
网络及存储负载由服务器的通用算力和软件处理,效率较低,不能满足高带宽、低延迟、高吞吐的性能需要。
异构资源管理
容器、虚拟机、裸金属分别部署在隔离的资源池,由各自的管理平台进行调度和运维,管理复杂,效率低下。
服务网格效率
云原生应用程序的每个数据包都必须通过Sidecar容器,数据包需要在应用程序和内核之间往返多次,导致服务网格效率低下,资源占用高。
整体方案
中科驭数凭借其深厚的技术积累和创新能力,提出的“IaaS on DPU”(IoD) 技术路线,既是通过 DPU 实现数据中心规模不断Scale-Out 的集大成者,也是基于 DPU 构建高性能算力底座的有效技术路径。在 loD 技术路线的实践过程中,中科驭数推出”驭云”高性能云底座解决方案,集成了先进的 DPU 技术,实现了软硬一体化的高效协同,填补了国内市场上公开、可商用的高性能云基础设施解决方案的空白。
该方案采用以自研 DPU 为核心、软硬件一体化的架构,提供统一管理、高可扩展性、高性能的 IaaS、PaaS 层面云服务。硬件层支持“一云多芯”和“3U 一体”的异构算力架构,可以满足通用性和信创两种业务需求;实现网络、存储、安全、管理等负载的卸载,释放服务器的硬件资源;实现网络和存储的性能加速,提升基础设施运行效率;实现容器应用服务网格的加速和卸载,大幅改善业务效率。另外,中科驭数还自研了云原生异构管理平台,并基于 Kubernetes 的插件机制开发了大量扩展组件,实现容器、虚拟机、裸金属异构资源的统一调度和运维管理,可大幅提升运维管理效率。
解决方案架构
IaaS on DPU 高性能云底座解决方案架构图
如图所示,从云服务视角来看,驭云高性能云底座解决方案是一个综合性的框架,包含计算、存储、网络、安全、PaaS、管理和接口等类别的众多子解决方案。
驭云高性能云底座解决方案通过一系列精心设计的子解决方案,应对不同行业、不同规模企业,在具体应用场景中遇到的各种挑战。这些子解决方案具有相对独立的技术架构、特性、软件包和最佳实践,在特定的领域为客户带来切实的价值和收益。
各类子解决方案不仅各自独立,同时也相互协同,共同构建起一个强大、灵活且可扩展的云基础设施平台。驭云高性能云底座解决方案在持续的开发和完善中,将不断的推出和发布丰富的子解决方案。
方案特点
容器、虚拟机、祼金属共池管理
· 基于DPU统一提供容器+虚拟化+裸金属底座,统一管理业务生命周期
· 统一管理算力资源,充分优化资源利用效率
· 统一提供网络、存储、安全处理能力,对业务系统提供相同基础设施平面
网络及存储加速
· OVS流表卸载到硬件,由硬件进行数据转发及隧道协议处理,显著提升网络性能
· 使用SR-IOV技术提供硬件虚拟网络设备,可获得与物理机相比拟的性能
· 通过硬件模拟向宿主机提供标准的NVMe/VirtIO块设备,实现存储硬件加速
释放服务器资源
· 网络组件、存储组件的控制面与转发面全部卸载到DPU
· K8S控制面组件卸载到DPU
· 服务网格边车集中卸载到DPU
微服务网格化治理优化
· 无侵入微服务治理方案,业务层面无需进行适配改造
· 自研的服务网格快路径提升网络速率,可获得极致的低时延
· 在DPU上运行集中式边车代理,减少分散式边车导致的资源消耗
方案价值
本方案以 DPU 为中心,实现容器、虚拟机、裸金属的共池管理和灵活调度,管理效率最高提升 2 倍;网络处理能力大幅提升,单机吞吐量提升 4 倍,存储处理性能大幅提升,存储 IOPS 性能提升 1.5 倍;服务器 99% 资源用于实际业务负载,大幅提升服务器的算效比;自研的服务网格快路径可以提升微服务网络速率,业务系统访问的 1/2RTT 可降低至 130us。