openeuler/uadk-bigdata架构详解:从硬件加速器到HBase的全栈加速通路
openeuler/uadk-bigdata架构详解从硬件加速器到HBase的全栈加速通路【免费下载链接】uadk-bigdataUADK is a general-purpose user space accelerator framework that uses the SVA technology to provide a unified programming interface for hardware acceleration computing cryptography and compression algorithms. Uadk-bigdata provides uadk solution in bigdata scenario.项目地址: https://gitcode.com/openeuler/uadk-bigdata前往项目官网免费下载https://ar.openeuler.org/ar/openEuler / uadk-bigdata是基于UADK通用用户空间加速器框架构建的大数据场景加速方案通过SVA技术为硬件加速计算、加密和压缩算法提供统一编程接口实现从底层硬件到上层HBase应用的全栈性能优化。一、UADK核心架构打通硬件加速的最后一公里 UADK作为连接硬件加速器与软件应用的桥梁其核心架构包含三个关键层次1.1 硬件加速层Kunpeng 920的算力引擎基于鲲鹏920处理器的硬件加速器包括ZIP压缩引擎、SEC安全引擎等是性能提升的物理基础。在使用前需通过BIOS配置开启SMMU支持图1BIOS中SMMU相关配置界面需确保Support Smmu和Smmu Work Around选项均设为Enabled1.2 内核驱动层uacce框架的交通枢纽Linux内核通过uacce用户空间访问加速器框架提供硬件抽象主要包含设备管理/dev/hisi*字符设备节点驱动模块hisi_zip压缩、hisi_sec2加密等内核模块权限控制需设置设备权限为777以支持用户空间访问验证命令示例lsmod | grep uacce\|hisi_sec2\|hisi_zip1.3 用户空间层WD库的编程接口UADK提供libwd库实现统一加速接口支持同步/异步操作模式多队列管理内存优化SVA共享虚拟地址主流算法支持SM4、GZIP等编译安装流程可参考项目文档uadk.md核心环境变量配置export WD_CIPHER_EPOLL_EN1 export WD_COMP_EPOLL_EN1二、全栈加速通路从HBase到硬件的数据高速公路 ️2.1 软件栈架构全景图uadk-bigdata构建了完整的技术栈实现端到端加速图2UADK大数据加速软件栈架构图展示从HBase到硬件加速器的完整调用链核心组件说明应用层Apache HBase 2.5.7 / Hadoop 3.4JDK层毕昇JDK 1.8.0 JCE/KAEPProvider加密层OpenSSL 3.0 uadk_provider加速层UADK框架 zlib-uadk硬件层uacce驱动 Kunpeng 920加速器2.2 关键技术路径GZIP压缩加速实现以HBase GZIP压缩为例UADK通过zlib-uadk库实现无缝加速库替换编译zlib-uadk并替换Hadoop原生zlibg -shared -fPIC -O3 -I/usr/local/include/uadk -L/usr/local/lib -lwd -lwd_comp -o libzuadk.so zlib_uadk.ccHadoop配置修改core-site.xml启用GZIP压缩property nameio.compression.codecs/name valueorg.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec/value /propertyHBase集成通过HBase PE测试验证性能详细配置流程见HbasewithUADK.md三、性能验证HBase加速效果直观呈现 3.1 延迟优化效果在HBase PE测试中启用UADK后随机读写延迟显著降低图3不同线程数下UADK启用前后的平均延迟对比单位微秒3.2 吞吐量提升数据随着并发线程增加UADK加速效果更加明显TPS/QPS提升可达3倍图4不同线程数下UADK启用后的TPS/QPS表现单位rows/s测试环境说明数据集20G/50G/100G压缩算法GZIP部署模式HBase/Hadoop伪分布式硬件平台Kunpeng 920服务器四、快速上手构建你的UADK加速环境 ⚡4.1 环境准备清单硬件Kunpeng 920处理器服务器系统openEuler 24.03 LTS软件Hadoop 3.4、HBase 2.5.7、毕昇JDK 1.8.04.2 核心配置步骤硬件使能参考uadk.md配置BIOS和内核参数UADK编译拉取代码并安装依赖git clone https://gitcode.com/openeuler/uadk-bigdata cd uadk-bigdataHadoop部署按BuildHadoopEnvironment.md配置伪分布式环境HBase配置参考BuildHbaseEnvironment.md完成部署性能测试运行script/main.py执行HBase PE测试五、总结UADK为大数据场景带来的价值 openeuler/uadk-bigdata通过创新的全栈加速架构为HBase等大数据应用提供了从硬件到软件的端到端优化方案。其核心价值体现在性能提升GZIP压缩吞吐量提升3倍延迟降低40%兼容性好无缝对接Zlib/OpenSSL生态应用零改造成本优化降低CPU占用率提高硬件资源利用率通过本文介绍的架构解析和部署指南开发者可以快速构建UADK加速环境充分发挥鲲鹏硬件的算力优势为大数据应用注入性能新动力。完整技术细节可参考项目文档库中的Quick.Start.Guide.md和Performance.testing.md。【免费下载链接】uadk-bigdataUADK is a general-purpose user space accelerator framework that uses the SVA technology to provide a unified programming interface for hardware acceleration computing cryptography and compression algorithms. Uadk-bigdata provides uadk solution in bigdata scenario.项目地址: https://gitcode.com/openeuler/uadk-bigdata创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考