高可用的集群中namenode宕机了,怎么恢复的?数据如何转移?
首先进入安全模式: hdfs dfsadmin -safemode enter然后刷一下active节点的log到image hdfs dfsadmin -saveNamespace然后将active节点的image文件全部拷贝到故障节点的相应目录下
然后重启故障namenode
最后hdfs namenode -bootstrapStandby到此,故障解决。
后来还解决过一次hdfs的block丢失的问题,也是将原先的image全部拷贝回来搞定的。
所以说,即便有ha,定期备份image文件还是很重要的。