利用自组织运行时系统的异构感知容错

摘要:利用多样性和隐式冗余性,现成的异构系统提供了在硬件和软件中检测和容忍任务执行期间的故障的机会。为了自动利用这种多样性,我们引入了在线学习运行时系统的扩展,它将现有的以性能为导向的任务映射与任务复制、多样性导向的映射策略和异构感知的多数投票器结合起来。这个扩展使用了一个新的度量标准来动态评估不可靠处理单元的剩余好处,并使用一种内存管理机制,在主机和设备内存中自动进行数据传输和检查点。

作者:Mario Kicherer, Wolfgang Karl

论文ID:1405.2912

分类:Operating Systems

分类简称:cs.OS

提交时间:2014-05-14

PDF 下载: 英文版 中文版pdf翻译中