一些想到的要思考的问题: 如何判断是否数据丢失?判断数据是否存在不一致问题?比如对账等 如果故障后,怎么快速恢复? 异步写入 MQ 失败,该怎么办? 计算任务,计算了一半,一部分结果已经产生存储下来,剩下一半因为服务器挂了,怎么识别出来,继续在新的机器上运行完成? 深入浅出分布式技术原理 Mapping 15 故障(一):预案管理竟然能让被动故障自动恢复?.md 16 故障(二):变更管理,解决主动故障的高效思维方式.md 15|故障(一):预案管理竟然能让被动故障自动恢复?-深入浅出分布式技术原理-极客时间 16|故障(二):变更管理,解决主动故障的高效思维方式-深入浅出分布式技术原理-极客时间 分布式技术原理与算法解析 Mapping 31 | 分布式高可用之故障恢复:知错能改,善莫大焉 32 | 答疑篇:如何判断并解决网络分区问题? 24 | FMEA方法,排除架构可用性隐患的利器