ClustOfVar:用于变量聚类的R包
摘要:变量聚类是一种将变量分组为同质群集的方式,即相互关联并提供相同信息的变量组。这些方法对于降维和变量选择非常有用。已经有一些专门用于数值变量聚类的方法。然而,对于定性变量或定性和定量变量的混合形式,提出的方法相对较少。R软件包ClustOfVar专门为此目的而开发。群集的同质性准则定义为与合成定量变量的相关比或平方相关之和(对于定性变量)。该合成变量是使用PCAMIX方法得到的第一主成分。提出了两种变量聚类算法:迭代重定位算法和升级层次聚类算法。我们还提出了一种自助法来确定合适的聚类数量。我们在小数据集上展示了这些方法和相关的软件包。
作者:M. Chavent, V. Kuentz, B. Liquet and L. Saracco
论文ID:1112.0295
分类:Computation
分类简称:stat.CO
提交时间:2012-12-12