基于调查和普查数据的多向列联表的顺序类别聚合和分割方法

摘要:大量的备用表在许多情况下出现,特别是在政府统计机构通过调查和人口普查数据收集时。因为这种情况下的绝大多数变量都有很多类别,机构和用户需要一种系统的方法来构建这些备用表的摘要表。在本文中,我们提出了一种方法,通过找到一类限制的对数线性模型的成员,最大化数据的似然性,并使用这个方法找到一种简明表示表格的方法。与分层对数线性模型(HLLM)中模型搜索的更标准的方法相比,我们的程序系统地减少了变量类别的数量。通过一系列的例子,我们说明了它可以保持与HLLM找到的相互作用结构的程度,并可用作HLL建模之前的数据简化程序。该程序的一个特点是它可以轻松应用于数百万个单元格的许多表格,为许多学科中的大型数据集提供了一种新的摘要方式。重点是信息和描述,而不是统计测试。该程序可以以不同的方式处理表格中的每个变量,保留全面的细节、将其视为完全名义的,或保留顺序。

作者:L. Fraser Jackson, Alistair G. Gray, Stephen E. Fienberg

论文ID:0811.1686

分类:Applications

分类简称:stat.AP

提交时间:2008-11-12

PDF 下载: 英文版 中文版pdf翻译中