使用vtree探索数据子集
摘要:变量树是一种探索离散多元数据的新方法。它们显示嵌套子集以及相应的频率和百分比。手动计算这些数量可能会很费时,特别是当有许多多级因素和缺失数据时。在这里,我们介绍了变量树及其在vtree R软件包中的实现,与现有方法(列联表、马赛克图、Venn/Euler图和UpSet)进行比较,并通过两个案例研究说明了它们的实用性。变量树可用于(1)揭示嵌套子集中的模式,(2)探索缺失数据以及(3)直接从数据框生成研究流程图(例如CONSORT图),以支持可重复性研究和开放科学。
作者:Nick Barrowman and Richard J. Webster
论文ID:2010.13252
分类:Computation
分类简称:stat.CO
提交时间:2021-02-08