数学和其他科学出版物中的相似性指数 带有方程式和公式的自我剽窃识别问题
摘要:无法估计包含方程式和公式的异质科学出版物的相似性指数的问题首次被讨论。表明方程和公式(以及图形、图纸和表格)的存在是一种复杂化因素,极大地复杂了对这些文本的研究。证明了基于考虑单个数学符号和方程式和公式部分的相似性指数确定方法是无效的,并且可能导致错误甚至完全荒谬的结论。研究了目前在科学期刊中使用的最流行的软件系统Antiplagiat和iThenticate检测剽窃和自我剽窃的可能性。展示了iThenticate系统对包含方程式和公式的具体示例和特定测试问题的处理结果。确定了在分析异质文本时,该软件系统通常无法区分自我剽窃和伪自我剽窃,似乎是真实的(但是虚假和想象的)自我剽窃。考虑了一个复杂的模型情况,其中识别自我剽窃需要高度专业化的专家的参与。提出了改进比较异质文本软件系统工作的各种方法。本文章对物理、数学和工程领域的研究人员和大学教师、处理图像识别问题和数字图像处理的程序员以及对剽窃和自我剽窃问题感兴趣的广大读者都将有所帮助。
作者:A.D. Polyanin, I.K. Shingareva
论文ID:2110.03872
分类:Digital Libraries
分类简称:cs.DL
提交时间:2021-10-11