自我诊断与大型语言模型:医疗误信息的新前沿
摘要:大型语言模型的应用对医疗保健的质量和可及性的提升仍然是全球各国的关切。因此,大型语言模型(LLMs)的兴起在研究人员和消费者中引发了大量关于医疗保健应用的讨论。虽然这些模型通过医学考试已被用来支持它们在医学培训和诊断中的使用,但其作为一种自我诊断工具的不可避免使用以及它们在传播医疗保健错误信息中的作用尚未得到评估。在这项工作中,我们从一般用户自我诊断的角度对LLMs的能力进行了批判性评估,以及LLMs在传播医疗保健错误信息方面的帮助手段。为了实现这一目标,我们开发了一种测试方法来评估模仿真实应用情况的开放性问题的回答。通过这样做,我们揭示了以下事实:a)这些模型的表现比以前所知的更差,b)它们表现出一些奇怪的行为,包括在陈述错误建议时过于自信,从而增加了传播医疗保健错误信息的风险。
作者:Francois Barnard, Marlize Van Sittert, Sirisha Rambhatla
论文ID:2307.04910
分类:Computers and Society
分类简称:cs.CY
提交时间:2023-07-12