基于调查和普查数据的多向列联表的顺序类别聚合和分割方法-arXiv论文预印本中文版

基于调查和普查数据的多向列联表的顺序类别聚合和分割方法

摘要：大量的备用表在许多情况下出现，特别是在政府统计机构通过调查和人口普查数据收集时。因为这种情况下的绝大多数变量都有很多类别，机构和用户需要一种系统的方法来构建这些备用表的摘要表。在本文中，我们提出了一种方法，通过找到一类限制的对数线性模型的成员，最大化数据的似然性，并使用这个方法找到一种简明表示表格的方法。与分层对数线性模型（HLLM）中模型搜索的更标准的方法相比，我们的程序系统地减少了变量类别的数量。通过一系列的例子，我们说明了它可以保持与HLLM找到的相互作用结构的程度，并可用作HLL建模之前的数据简化程序。该程序的一个特点是它可以轻松应用于数百万个单元格的许多表格，为许多学科中的大型数据集提供了一种新的摘要方式。重点是信息和描述，而不是统计测试。该程序可以以不同的方式处理表格中的每个变量，保留全面的细节、将其视为完全名义的，或保留顺序。

作者：L. Fraser Jackson, Alistair G. Gray, Stephen E. Fienberg

论文ID：0811.1686

分类：Applications

分类简称：stat.AP

提交时间：2008-11-12

PDF 下载： 英文版中文版pdf翻译中