HyperTools:用于可视化和操作高维数据的Python工具箱
摘要:通过数据可视化可以揭示原始数据或摘要统计数据中不明显的趋势和模式。尽管对低维数据进行可视化相对简单(例如,在图表上绘制变量随时间变化的x,y坐标),但如何用同样直观的方式可视化高维数据集并不总是明显的。在这里,我们提出了HypeTools,这是一个用于可视化和操作大型高维数据集的Python工具箱。我们主要的方法是使用降维技术(Pearson, 1901; Tipping & Bishop, 1999)将高维数据集嵌入到较低维空间中,并使用一个简单但功能强大的API来进行数据操作(例如超对齐(Haxby et al., 2011)、聚类、归一化等)和绘图样式。该工具箱是围绕数据轨迹和点云的概念设计的。就像通过空间中移动的物体的位置可以被可视化为三维轨迹一样,HyperTools使用降维算法为高维观测的时间序列创建类似的二维和三维轨迹。可以将这些轨迹作为交互式静态图或动画进行可视化。同样的降维和对齐算法也可以揭示静态数据集中的结构(例如,一组观测或属性)。我们展示了几个例子,通过使用我们的工具箱通过轨迹和低维嵌入来探索数据,可以发现跨多个领域的数据集中的深层见解。
作者:Andrew C. Heusser and Kirsten Ziman and Lucy L. W. Owen and Jeremy R. Manning
论文ID:1701.08290
分类:Other Statistics
分类简称:stat.OT
提交时间:2017-01-31