GFS 的容错包括 Master 容错和 Chunk 服务器容错。

如下图所示,当主 Master 服务器正常工作时,备 Master 服务器会实时备份主Master 服务器上的元数据信息。当主 Master 服务器出现故障不可用时,备 Master 服务器能够迅速接管其工作,对 GFS 提供服务。

如下图所示,正常情况下 Chunk 服务器 1、Chunk 服务器 2 和 Chunk 服务器 3 上分别保存着一个 Chunk 副本,当 Chunk 服务器 1 发生故障不可用,或者 Chunk 服务器 1 上存放的 Chunk 副本丢失或者损坏导致 Chunk 副本不可用时,Master 服务器会协调其中一台保存有相同 Chunk 副本的 Chunk 服务器(这里是 Chunk 服务器 3),将对应的 Chunk 副本复制到集群中其他正常的 Chunk 服务器上(这里是 Chunk 服务器 4)。

以上内容摘自《海量数据处理与大数据技术实战》电子书,点击https://developer.aliyun.com/topic/download?id=8205可下载完整版