R编程语言的扩展和演进

摘要:编程语言的使用变化是由文化因素驱动的;目前尚不清楚这是否也适用于程序设计语言。虽然这些语言是为人类设计的,但与计算机硬件而非人类受众的交互可能限制了术语词汇的演变机会。本研究在R语言中进行了测试,R是一种开源、成熟且常用于统计计算的编程语言。在一个包括2014年至2021年间发布的360,321个GitHub代码库的语料库中,作者提取了168,857,044个R语言的函数调用作为n-grams。在八年的时间里,R语言经历了快速的多样化和大量的词汇变化,这是由于tidyverse社区包集合的日益流行所推动的。作者的研究结果表明,用户可以影响编程语言的演变,并产生与自然语言观察到的模式相符合,反映了基因演化。R语言的演变可能是因为分析复杂性的增加,吸引了新用户使用R,从而对替代性词汇和相关词汇变化产生了选择性压力。这种变化的速度和程度可能对R语言和类似语言中所体现的分析和科学研究的可读性和连续性产生连锁影响。

作者:Timothy L Staples

论文ID:2208.12382

分类:Programming Languages

分类简称:cs.PL

提交时间:2022-08-29

PDF 下载: 英文版 中文版pdf翻译中