通过时空数据模型解释自组织映射

摘要:自组织映射(SOMs)是一种使用高维数据向量的技术,用于开发一组原型状态(节点),该节点在某种意义上跨越高维空间。值得注意的应用包括描述一个区域内的天气变量所描述的天气状态和以时间频率为特征的语音模式。SOM方法本质上是一种神经网络模型,它实现了从高维输入空间到低维神经元阵列的非线性投影。在这个过程中,它也成为一种聚类技术,将高维数据空间中任何向量分配给与其在数据空间中最近的节点(神经元)(例如,使用欧氏距离)。因此,节点的数量等于聚类的数量。然而,SOM的主要用途是作为一种表示技术,即找到一组节点,这些节点代表性地跨越高维空间。这些节点通常使用地图显示,以便可视化数据空间的连续性。这种技术似乎在统计文献中没有讨论过,因此我们在这里的目的是引起社区的注意。通过算法在一组训练向量上实现这种技术。然而,通过引入随机性,即时空过程模型,我们试图在日常数据收集应用的背景下阐明和解释其性能。也就是说,观察到的日常状态向量被视为多元过程实现的时间序列,我们试图通过SOM过程实现的维度缩减来理解。

作者:Huiyan Sang, Alan E. Gelfand, Chris Lennard, Gabriele Hegerl, Bruce Hewitson

论文ID:0901.3494

分类:Applications

分类简称:stat.AP

提交时间:2009-01-23

PDF 下载: 英文版 中文版pdf翻译中