用户识别:多用户视觉辅助通信的关键推动因素

摘要:基于视觉辅助的无线通信吸引着越来越多的关注,并在各种无线通信应用中找到了新的用例。这些基于视觉辅助的通信框架利用由基础设施或移动设备上安装的摄像头捕获的视觉数据通过深度学习、计算机视觉和视觉场景理解等进展来构建对通信环境的某种感知。先前的工作已经研究了毫米波(mmWave)系统中的基于视觉辅助的波束、阻塞和切换预测问题,以及大规模MIMO系统中的基于视觉辅助的协方差预测问题。然而,这些先前的工作仅关注摄像头前单一对象(用户)的场景。在本文中,我们将“用户识别”任务定义为现实场景下基于视觉辅助的通信系统的关键因素,该系统可以在拥挤的场景中运行并支持多用户应用。用户识别任务的目标是从视觉场景中的其他候选对象(干扰物)中识别目标通信用户。我们开发了能够处理视觉和无线数据的单帧或帧序列的机器学习模型,以有效地在视觉/通信环境中识别目标用户。通过使用基于真实世界测量的大规模多模态感知和通信数据集DeepSense 6G,我们展示了开发的方法在现实设置中可以成功地以超过97%的准确率识别目标用户。这为将基于视觉辅助的无线通信应用扩展到真实场景和实际部署铺平了道路。

作者:Gouranga Charan and Ahmed Alkhateeb

论文ID:2210.15652

分类:Signal Processing

分类简称:eess.SP

提交时间:2023-08-08

PDF 下载: 英文版 中文版pdf翻译中