捕捉高容量流处理中的数据不确定性
摘要:设计和开发一种数据流系统,从数据收集到查询处理到最终结果生成中捕获数据不确定性。我们的系统专注于自然建模为连续随机变量的数据。对于这样的数据,我们的系统采用基于概率和统计理论的方法来捕获数据不确定性,并将这种方法融入到高容量流处理中。我们系统的第一个组件捕获传感设备的原始数据流的不确定性。由于这些原始流可能非常嘈杂并且可能不包含足够的信息用于查询处理,我们的系统采用数据生成过程的概率模型和流速推理来将原始数据转换成具有不确定性指标的所需格式。第二个组件捕获数据通过查询操作符时的不确定性。为了有效地量化查询操作符的结果不确定性,我们探索了一系列基于概率和统计理论的技术,以流速计算结果分布。我们目前正在与一组科学家合作,使用从危险天气监测和物体跟踪和监测领域收集的跟踪评估我们的系统。(标题:一个捕获数据流中的不确定性的系统设计和开发)
作者:Yanlei Diao (U. Massachusetts-Amherst), Boduo Li (University of Massachusetts Amherst), Anna Liu (UMass Amherst), Liping Peng (UMass Amherst), Charles Sutton (UC Berkeley), Thanh Tran (UMass Amherst), Michael Zink
论文ID:0909.1777
分类:Databases
分类简称:cs.DB
提交时间:2009-09-15