逻辑回归和其他回归模型的弱信息默认先验分布

摘要:一种基于学生t先验分布构建的传统(非分层)逻辑回归模型新的先验分布,该模型首先将所有非二进制变量进行缩放,使其均值为0,标准差为0.5,然后在系数上放置独立的学生t先验分布。作为默认选择,我们推荐具有中心0和尺度2.5的柯西分布,这在最简单的情况下是一个长尾版本的分布,即假设逻辑回归中有一半额外的成功和一半额外的失败。对数据集集合进行交叉验证显示,柯西先验分布超出了现有的高斯和拉普拉斯先验分布的实现。我们建议将这种先验分布作为常规应用的默认选择。它的优点是即使在逻辑回归中存在完全分离的情况下(即使样本量很大且预测变量的数量很小,这也是一个常见问题),它也总能给出答案,并且自动对高阶交互作用应用更多的收缩。这在常规数据分析以及用于处理缺失数据插补的自动化程序(如链式方程)中非常有用。我们在R中实现了一个过程,使用学生t先验分布对广义线性模型进行拟合,通过将近似EM算法结合到通常的加权最小二乘法中。我们通过多个应用进行说明,包括一系列预测选民偏好的逻辑回归、小型生物试验和公共卫生数据集的插补模型。

作者:Andrew Gelman, Aleks Jakulin, Maria Grazia Pittau, Yu-Sung Su

论文ID:0901.4011

分类:Applications

分类简称:stat.AP

提交时间:2009-01-27

PDF 下载: 英文版 中文版pdf翻译中