自然序列的快速熵估计
摘要:使用已知数据的某些方面来更有效地计算和估计符号序列的香农熵已成为众所周知的问题。已经提出了许多在小样本量下计算熵的方法,这些方法具有不同的假设。本文中,我们研究并提出了一种用于估计一组排名符号自然事件的香农熵的方法。我们使用了改进的Zipf-Mandelbrot-Li定律和一种新的基于排名的巧合计数方法,提出了一种有效的算法,可以仅使用少量样本就能以令人惊讶的准确度估计熵。该算法在一些自然序列上进行了测试,并显示在很小的数据量下可以得到准确的结果。
作者:Andrew D. Back, Daniel Angus and Janet Wiles
论文ID:1805.06630
分类:Data Analysis, Statistics and Probability
分类简称:physics.data-an
提交时间:2018-05-18