标准化率控制已测量和未测量的疾病风险因素混杂的通用公式

摘要:标准化在人群研究或疾病登记数据中是一种常见的用于控制混杂因素的方法,其定义为分层特定率的加权平均值。通常情况下,关于构建特定标准化率的讨论认为分层是固定的,并聚焦于影响权重规定的考虑因素。每年都使用称为“年龄直接标准化”的加权程序对SEER(美国癌症数据库)的数据进行分析。为了评估直接标准化的性能,我们定义了一类通用标准化算子。我们将特定标准化率视为算子和给定数据集的输出。基于算子的函数形式,我们定义了一类通过测量的危险因素来控制混淆的标准化算子子类。利用基本疾病概率推理范式,我们建立了在存在未测量的癌症风险因素的情况下,通过这些算子产生的年度标准化率对比所能得出的结论。这些结论采取了推翻关于给定所有风险因素(包括测量和未测量的)的疾病条件概率以及给定测量风险因素的未测量风险因素的条件概率的特定假设的形式。我们展示了这些推翻与每年在《全国癌症状态年度报告》中报告的直接标准化率对比所做的推断之间的一一对应关系。

作者:Steven D. Mark

论文ID:0811.1842

分类:Applications

分类简称:stat.AP

提交时间:2008-11-13

PDF 下载: 英文版 中文版pdf翻译中