ChatGPT和Microsoft Bing AI Chat在越南国家高中毕业考试物理科目中的表现评估

摘要:使用基于语言模型的方法来教授物理学存在的问题和挑战在本研究中得到了评估。该研究评估了ChatGPT和BingChat这两个最先进的大型语言模型(LLMs)在回答2019年至2023年越南物理学高中考试题目时的表现。通过将LLMs的结果与越南学生的分数进行比较,我们发现ChatGPT和BingChat的表现都不如越南学生,证明在物理学教学领域,LLMs还不能完全取代人类智力。研究结果还显示,这两个LLM都无法回答高级应用级别的问题。在准确度方面,BingChat通常优于ChatGPT,尽管ChatGPT表现更加稳定。我们的研究表明,LLMs可以在学习和教学活动中帮助学生和教师,尤其是通过提供即时反馈和个性化学习体验。

作者:Dao Xuan-Quy and Le Ngoc-Bich and Phan Xuan-Dung and Ngo Bac-Bien and Vo The-Duy

论文ID:2306.04538

分类:Physics Education

分类简称:physics.ed-ph

提交时间:2023-06-22

PDF 下载: 英文版 中文版pdf翻译中