逻辑回归和其他回归模型的弱信息默认先验分布-arXiv论文预印本中文版

逻辑回归和其他回归模型的弱信息默认先验分布

摘要：一种基于学生t先验分布构建的传统（非分层）逻辑回归模型新的先验分布，该模型首先将所有非二进制变量进行缩放，使其均值为0，标准差为0.5，然后在系数上放置独立的学生t先验分布。作为默认选择，我们推荐具有中心0和尺度2.5的柯西分布，这在最简单的情况下是一个长尾版本的分布，即假设逻辑回归中有一半额外的成功和一半额外的失败。对数据集集合进行交叉验证显示，柯西先验分布超出了现有的高斯和拉普拉斯先验分布的实现。我们建议将这种先验分布作为常规应用的默认选择。它的优点是即使在逻辑回归中存在完全分离的情况下（即使样本量很大且预测变量的数量很小，这也是一个常见问题），它也总能给出答案，并且自动对高阶交互作用应用更多的收缩。这在常规数据分析以及用于处理缺失数据插补的自动化程序（如链式方程）中非常有用。我们在R中实现了一个过程，使用学生t先验分布对广义线性模型进行拟合，通过将近似EM算法结合到通常的加权最小二乘法中。我们通过多个应用进行说明，包括一系列预测选民偏好的逻辑回归、小型生物试验和公共卫生数据集的插补模型。

作者：Andrew Gelman, Aleks Jakulin, Maria Grazia Pittau, Yu-Sung Su

论文ID：0901.4011

分类：Applications

分类简称：stat.AP

提交时间：2009-01-27

PDF 下载： 英文版中文版pdf翻译中