树结构场景上的快速GPU边界框

摘要:高性能渲染中的边界框计算是一个基本问题,因为它是可见性裁剪和分组操作的输入。在按树结构描述的场景中,剪辑节点和混合节点分别涉及边界框的交集和并集。在CPU上使用顺序算法很容易计算,但是高效的并行GPU算法更加困难。本文提出了一个快速实用的解决方案,其核心是新的经典括号匹配问题算法。该核心算法以抽象的方式呈现(以PRAM抽象为基础),然后具体映射到真实GPU硬件的线程、工作组和调度级别上。算法利用可移植的计算着色器进行实现,并且性能结果显示与顺序CPU版本相比,速度显著提高,并且接近GPU硬件的最大理论吞吐量的合理比例。即时的应用动机是2D渲染,但算法可以推广到其他领域,而核心括号匹配问题也具有其他应用,包括解析。

作者:Raph Levien

论文ID:2205.11659

分类:Graphics

分类简称:cs.GR

提交时间:2022-05-25

PDF 下载: 英文版 中文版pdf翻译中