准确的临床毒性预测:多任务深度神经网络与对比分子解释
摘要:可解释的机器学习方法在分子毒性预测方面是一种有前景的方法,可以提高药物开发和化学安全的效率。毒性的预测机器学习模型可以减少实验成本和时间,并通过大幅减少动物和临床测试来缓解伦理关注。在本文中,我们使用深度学习框架同时对体外、体内和临床毒性数据进行建模。我们使用了两种不同的分子输入表示法:Morgan指纹和预训练的SMILES嵌入。多任务深度学习模型可以准确预测所有终点的毒性,包括临床毒性,这通过AUROC和平衡准确度指标进行了验证。特别是,与现有的MoleculeNet基准模型相比,将SMILES嵌入作为多任务模型的输入可以改进临床毒性的预测。此外,我们的多任务方法在体外、体内和临床平台上都与最先进的方法相媲美,全面性得到了保证。通过多任务模型和迁移学习,我们能够确定临床毒性预测中对体内数据的最低需求。为了提供置信度和解释模型的预测,我们采用了一种事后对比解释方法,返回相关的正向和负向特征,这些特征与已知的致突变和反应性毒性团结构相对应,如未置换的键合杂原子、芳香胺和Michael受体。此外,通过相关特征分析检测到的毒性团结构更多地涵盖体外(53%)和体内(56%)的终点,而不是临床终点(8%),并且确实发现已知毒性团结构数据中对体外和体内实验数据的偏好。据我们所知,这是首次对临床和体内分子毒性预测进行全面的对比解释,包括现有和不存在的亚结构。
作者:Bhanushee Sharma, Vijil Chenthamarakshan, Amit Dhurandhar, Shiranee Pereira, James A. Hendler, Jonathan S. Dordick, Payel Das
论文ID:2204.06614
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2022-04-15