无需运行时检查点,实现具有容错能力的间歇性系统

摘要:自供电间歇系统通常采用运行时检查点作为一种手段,以便在电力周期中积累计算进度,并从电力故障中恢复系统状态。然而,现有的基于检查点范式的方法通常需要系统暂停和/或运行时日志记录,本文提出了一种设计,克服了基于检查点方法的缺点,实现了具有容错性的间歇系统。我们的设计允许在频繁的电力故障下进行累积执行和即时系统恢复,同时通过利用混合内存中访问的数据的特性,实现并发任务执行的串行化,改善计算进度并确保数据一致性,而无需在运行时暂停系统。我们将设计集成到在德州仪器设备上运行的FreeRTOS中。实验结果表明,当电源太弱无法使基于检查点的方法取得进展时,我们的设计仍然可以积累进展,并且在相对较强的电源下,计算进度提高了至少43%,同时减少了至少90%的恢复时间。

作者:Wei-Ming Chen, Tei-Wei-Kuo, and Pi-Cheng Hsiu

论文ID:1910.04949

分类:Operating Systems

分类简称:cs.OS

提交时间:2019-10-14

PDF 下载: 英文版 中文版pdf翻译中