使用patentpy和patentr访问美国大规模专利数据

摘要:美国专利商标局(USPTO)提供了包含从1976年以来所有专利信息的公开可访问的批量数据文件。然而,这些文件的格式会随着时间变化而变化,并且内存效率低下,这可能对个人研究者造成困扰。在这里,我们介绍了用于Python和R编程语言的patentpy和patentr软件包。它们允许用户从USPTO网站上以编程方式获取批量数据,并在本地以清洁、矩形的格式进行访问。依赖于美国专利数据的研究将受益于使用patentpy和patentr。我们描述了软件包的实施、质量控制机制,并呈现了使用该软件的简单而有效的应用案例。

作者:James Yu, Hayley Beltz, Milind Y. Desai, P''eter ''Erdi, Jacob G. Scott, Raoul R. Wadhwa

论文ID:2107.08481

分类:Digital Libraries

分类简称:cs.DL

提交时间:2021-07-20

PDF 下载: 英文版 中文版pdf翻译中