使用ChatGPT进行物理教育研究中的教育数据增强

摘要:使用生成式AI技术,例如大规模语言模型,展示了增强教育研究的新潜力。例如,已经证明生成式大规模语言模型能够解决物理学中的定量推理任务和概念测试,如力学概念问卷。鉴于这些概念问卷对物理教育研究的重要性以及开发它们所面临的挑战,诸如与代表性人群进行现场测试,本研究旨在检查在何种程度上可以利用生成式大规模语言模型生成一个在FCI中具有响应相关变异性的合成数据集。我们使用最近推出的基于GPT-4生成式大规模语言模型的ChatGPT,并研究ChatGPT在多大程度上可以准确解决FCI(RQ1),并被激励以解决FCI,就像它是属于不同队列的学生一样(RQ2)。此外,我们研究ChatGPT在多大程度上可以被激励以解决FCI,就像它是具有不同力学相关误解的学生一样(RQ3)。与其他研究一致,我们发现ChatGPT能够准确解决FCI。我们还发现,激励ChatGPT以回答该问卷,就像它属于不同队列一样,不会产生响应的差异,然而,以具有特定误解的学生的身份回答该问卷会产生与FCI上实际人类响应相近的方面的响应差异。

作者:Fabian Kieser, Peter Wulff, Jochen Kuhn and Stefan K"uchemann

论文ID:2307.14475

分类:Physics Education

分类简称:physics.ed-ph

提交时间:2023-07-28

PDF 下载: 英文版 中文版pdf翻译中