识别过度圆整或截断的数据

摘要:数据都是数字化的,因此本质上是整数而不是真实的实数。通常情况下,这不会引起困难,因为截断或舍入通常发生在噪声水平以下。然而,在某些情况下,当仪器或数据传输和存储系统对数据或后续数据分析的处理不够理想时,数字化的影响可能与数据中包含的重要特征相当。在这些情况下,信息已经在截断过程中不可逆地丢失。虽然存在处理截断数据的技术,但我们提出了一种直接的方法,可以在数据分析阶段之前检测到这个问题。该方法基于一种最佳直方图分bin算法,可以确定数字化的统计结构与数据集本身的统计结构相当。

作者:Kevin H. Knuth, J. Patrick Castle, and Kevin R. Wheeler

论文ID:1602.04292

分类:Data Analysis, Statistics and Probability

分类简称:physics.data-an

提交时间:2016-02-16

PDF 下载: 英文版 中文版pdf翻译中