5G NR CSI数据集与无线感知技术应用
1. 5G NR CSI数据集概述信道状态信息Channel State Information, CSI是无线通信系统中的关键参数它描述了信号在传播路径上的衰减、相位变化和多径效应等特性。在5G新空口NR系统中CSI的精确获取对于实现高效的数据传输、波束成形和用户调度至关重要。近年来研究人员发现CSI不仅可以用于传统的通信优化还能支持一系列创新的感知应用如用户定位、环境感知和设备分类等。然而目前公开可用的真实世界5G NR CSI数据集非常稀缺。大多数研究依赖于仿真数据或Wi-Fi系统的CSI测量这些数据与实际的5G NR系统存在显著差异。为了填补这一空白苏黎世联邦理工学院ETH Zurich的研究团队利用NVIDIA Aerial RAN CoLab Over-the-AirARC-OTA平台构建了一个完整的5G NR测试床并采集了三类重要的CSI数据集室内实验室/办公室环境数据集在一个3.5m×3.5m的区域内使用搭载5G模组的自动清洁机器人收集CSI数据同时利用高精度红外追踪系统记录设备的真实位置。室外校园环境数据集在10m×10m的开放空间通过机器人平台携带商用智能手机三星Galaxy S23移动采集多天线、多基站条件下的CSI测量值。设备分类数据集使用6种不同的商用终端设备包括多款iPhone和Android手机在旋转平台和人工移动场景下采集CSI特征用于设备指纹识别研究。关键提示这些数据集的一个独特价值在于它们都包含了精确的时空标签。室内和室外数据集通过WorldViz PPT系统实现了厘米级的位置标注而设备分类数据集则严格记录了每台设备的型号和使用场景。这种数据标签的完整结构为机器学习算法的训练和验证提供了理想的基础。2. 测试床系统架构与关键技术2.1 硬件配置ETH Zurich的5G NR测试床采用了分布式MIMO架构核心硬件组成包括射频单元4个商用开放无线接入网O-RU单元每个单元配置4发4收4T4R天线工作于3.45GHz频段5G NR N78频段总带宽100MHz。基带处理NVIDIA MGX GH200服务器运行完整的5G协议栈包括NVIDIA Aerial L1实现物理层信号处理OpenAirInterfaceOAIL2处理MAC和RLC层OAI核心网完成高层协议处理同步系统精密时间协议PTP主时钟配合全球导航卫星系统GNSS时间参考确保整个系统的时间同步精度优于100ns。位置追踪WorldViz PPT红外光学追踪系统通过6个高精度摄像头实时捕捉设备上的标记点提供毫米级的三维位置信息。2.2 软件架构与数据采集测试床的软件栈实现了从物理层到应用层的完整5G NR功能特别设计了高效的数据采集管道实时信号处理利用NVIDIA CUDA加速的PyAerial库完成上行链路的信道估计提取每个物理资源块PRB的CSI矩阵。数据记录NVIDIA DataLake系统同时捕获前传FHIQ采样数据L2层协议信息FAPI接口时间戳和无线网络临时标识RNTI特征提取离线处理环节对原始CSI数据进行降维和特征工程生成适用于不同机器学习任务的输入特征。表1总结了测试床的关键系统参数参数值通信标准3GPP Release 15载波频率3.45 GHz系统带宽100 MHz有效子载波数3,276子载波间隔30 kHzO-RU数量4每O-RU天线数4 (4T4R)O-RU发射功率1 WPUSCH目标SNR28 dBTDD模式3DSU3. CSI在用户定位中的应用3.1 神经网络定位原理基于CSI的神经网络定位Neural Positioning采用监督学习范式其核心思想是将CSI特征与空间位置建立映射关系。具体实现包括以下关键步骤特征提取对每个PUSCH时隙中的3个DMRS符号进行平均计算CSI幅度值并进行12倍降采样最终形成每个O-RU天线的273维特征向量。网络架构采用多层感知机MLP输出层设计为概率图形式——网络预测预设网格点上存在设备的概率最终位置通过后验均值估计得到。损失函数使用二元交叉熵衡量预测概率图与真实位置的差异通过Adam优化器进行端到端训练。3.2 定位性能分析在室内环境中测试床实现了惊人的0.6cm平均绝对误差MAE。图1展示了定位结果的散点分布可见预测位置右图与真实轨迹左图高度吻合。值得注意的是即使在测试集包含连续轨迹的情况下蓝色路径系统仍保持0.7cm的定位精度证明了算法的泛化能力。室外场景由于多径效应更复杂定位误差有所增加但仍达到5.7cm MAE。性能下降的主要原因包括更大的覆盖范围10m×10m vs 3.5m×3.5m环境动态性行人移动、树木摆动等天线高度差引起的非平面波传播表2对比了不同场景下的定位误差统计场景平均误差(cm)中值误差(cm)95%误差(cm)室内0.60.51.3室外5.74.613.24. 信道图表绘制技术4.1 算法原理信道图表Channel Charting是一种无监督的伪定位技术其核心目标是在不依赖位置标签的情况下通过CSI特征保持空间邻近关系。测试床实现了两种先进算法三元组损失法构建锚点-正样本-负样本三元组约束相近时刻的CSI在隐空间中距离更近。这种方法能保持局部几何结构但缺乏绝对坐标参考。真实坐标映射法在三元组损失基础上增加双边定位bilateration损失利用已知的O-RU位置信息将接收信号强度RSS差异转化为空间约束。4.2 实现细节特征工程环节采用延迟域处理对全带宽CSI幅度平方后做IFFT取前25个抽头拼接实部和虚部形成50维/天线的特征向量归一化后输入全连接网络训练采用两阶段策略前200轮仅用三元组损失学习局部结构后100轮加入双边损失约束全局位置4.3 性能评估室外测试表明纯三元组方法能保持98.2%的连续性和97.4%的可信度图8b。加入真实坐标约束后系统实现了73cm MAE的绝对定位精度图8c同时保持了98.0%的连续性。这一结果证明即使没有显式的位置标签通过合理设计损失函数信道图表也能实现有物理意义的空间映射。5. 设备分类应用5.1 射频指纹提取设备分类的核心挑战是从CSI中分离出设备相关的指纹特征。测试床采用基于奇异值分解SVD的特征提取方法对每个时隙的CSI矩阵3276子载波×16天线×3符号进行列归一化计算紧凑SVD取主导左奇异向量重构为3276×3×2的张量子载波×符号×实虚部这种特征能有效抑制信道影响突出设备硬件特性如功放非线性、本振相位噪声等。5.2 分类网络设计采用改进的ResNet架构输入层适配CSI特征的3D卷积主干网络4个残差块每块包含2个卷积层输出层softmax分类器训练策略优化器RMSprop学习率初始1e-3验证损失停滞10轮后衰减0.2倍早停验证损失30轮不改善则终止5.3 跨日测试结果设备分类展示了令人印象深刻的泛化能力同一天测试准确率达99%图9隔天测试环境略有变化仍保持95%准确率图10特别值得注意的是对于同型号设备两台iPhone 14 Pro系统能区分具体个体1a vs 1b隔天混淆率仅8%。这表明CSI包含足够细粒度的硬件指纹信息。6. 实际部署考量基于这项研究的实践经验我们总结出几点关键建议天线布局优化分布式MIMO架构多O-RU协同相比单基站能显著提升定位精度。建议部署时保证天线空间分集避免共面布置。时间同步纳秒级同步是保证CSI相位一致性的前提。实际部署中建议采用光纤传输PTP协议或GNSS同步方案。环境适应性室内环境需注意家具布局变化对CSI的影响室外部署要考虑天气因素雨雪对3.5GHz传播的影响定期重校准特别是设备分类应用计算资源实时处理100MHz带宽的CSI数据需要相当的算力。实测表明NVIDIA GH200服务器能同时处理4个O-RU的实时数据流延迟控制在10ms以内。这套系统已经应用于多个实际场景包括智能工厂中的AGV精确定位商场客流分析系统设备认证增强安全方案随着5G-Advanced和6G技术的发展CSI感知的应用场景将进一步扩展。研究团队计划继续丰富数据集涵盖更复杂的传播环境如NLOS场景和三维运动轨迹推动下一代无线感知技术的演进。