通过利用辅助信息提高细胞扰动实验的准确性
摘要:在现代细胞干扰实验中,将细胞暴露在数百种刺激物(如细胞因子或CRISPR导向子)的面板中。这些实验旨在研究是否通过每种处理来上调或下调特定基因。然而,由于实验噪声水平较高,通常的上调或下调基因的估计器会产生许多错误。本文提出了两个贡献。第一个贡献是一种利用高斯过程和因子分析来利用与处理之间相似性的辅助信息(例如,用于干扰细胞的药物之间的化学相似性)的新调控效应估计器。这种新估计器通常具有较低的方差,而不使用辅助信息的未规则化估计器则具有更高的偏差。为了评估这种新估计器是否提高了准确性(即在偏差和方差之间取得了有利的权衡),我们不能简单地计算其在留置数据上的误差,因为关于处理效应的“基本事实”是不可用的。我们的第二个贡献是一种新颖的数据分割方法来评估错误率。这种数据分割方法使用“符号有效”估计器产生有效的误差界限,按定义其结果正确的次数要超过错误的次数。使用这种数据分割方法,通过一系列案例研究,我们发现我们利用辅助信息的新估计器可以使S类型错误率降低三倍。
作者:Jackson Loper and Noam Solomon and Jeffrey Regier
论文ID:2307.11686
分类:Applications
分类简称:stat.AP
提交时间:2023-07-24