问题描述:namenode进程缺失
可能影响:
- 非HA集群,hdfs服务不可用
- HA集群,hdfs元数据editslog无法周期进行checkpoint生成fsimage,这种情况下,active namenode 重启时,需要加载大量的editslog(异常时间点到重启时),可能引起重启耗时过长,影响集群正常使用
- HA集群,namenode的failover机制失效
建议:
1、在EMR控制台首页,选择“集群服务>HDFS>角色管理”,尝试重启该namenode进程。
2、若重启失败或具体原因排查,请收集namenode日志(登录进程异常节点,进入/data/emr/hdfs/logs目录,收集xx.log,xx.out日志),联系腾讯云售后人员