多语种印度文字的光学脚本识别

摘要:脚本识别和文本识别是人工智能应用中的主要领域之一。在数字化时代,使用数字记事本已经成为一种常见做法。然而,传统的用纸笔写作仍然是主要的方式。这导致脚本的分类基于它们的获取方法。对当前处理和识别方法的调查对研究人员将会有益处。本文旨在讨论脚本预处理和文本识别技术的进展。在印度,有12种突出的印度语脚本,与英语不同,这些脚本具有多层特征。复杂的特征比如文本形状的相似性使得它们难以识别和分析,因此需要先进的预处理方法来准确识别。本调查试图在所有算法之间提供比较。我们希望这项调查能为不仅在印度语脚本上工作,还在其他语言上工作的研究人员提供一些见解。

作者:Sidhantha Poddar and Rohan Gupta

论文ID:2308.05780

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-14

PDF 下载: 英文版 中文版pdf翻译中