专利名称 | 一种用于机群容错的系统和方法 | 申请号 | CN200810211566.3 | 专利类型 | 发明专利 | 公开(公告)号 | CN101377750 | 公开(授权)日 | 2009.03.04 | 申请(专利权)人 | 中国科学院计算技术研究所 | 发明(设计)人 | 霍志刚 | 主分类号 | G06F11/00(2006.01)I | IPC主分类号 | G06F11/00(2006.01)I;G06F11/14(2006.01)I | 专利有效期 | 一种用于机群容错的系统和方法 至一种用于机群容错的系统和方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开了一种用于机群容错的系统和方法。该系统包括:检查点服务 器,其网络连接到所述多个结点,用于收集并行应用的所有进程的信息,向结 点发送监控请求,并响应来自结点的检查点操作请求,并将检查点文件保存于 检查点文件服务器上;在检查点切取操作完成后,执行检查点恢复操作;检查 点文件服务器,其网络连接到所述多个结点,用于存储检查点文件,并在进程 恢复过程中提供检查点文件访问支持;故障监测模块,位于所述结点上,用于 根据所述监控请求来监测本地结点的操作系统的运行状态和所述监控请求指 定进程的指定运行状态,以及所述监控请求指定的硬件部件的指定状态,并在 监测到故障时向所述检查点服务器发送检查点操作请求。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障