云监控异常的常见原因有:云监控组件对应的2个服务BaradAgentSvc、StargateSvc 未安装完整,比如漏了其中1个。或者是更改了默认dns导致内网域名解析有问题进而影响了数据上报。vpc机器的dns至少需要有一个是vpc默认2个DNS之一(183.60.83.19、183.60.82.98),基础网络机器需要确保第一个dns是对应可用区的内网默认DNS。另外,基础网络tat必须卸载,基础网络tat可能影响所有跟网络相关的服务。
修复云监控的基本顺序是:查看dns是否能正常解析内网域名,如果不能请调整dns使能,然后卸载云监控组件,参考官网文档重装组件。
1、如何卸载云监控组件有两种办法
①管理员身份打开powershell执行如下命令
sc.exe stop BaradAgentSvc 2>$null 1>$null
sc.exe config BaradAgentSvc start= disabled 2>$null 1>$null
sc.exe delete BaradAgentSvc 2>$null 1>$null
sc.exe stop StargateSvc 2>$null 1>$null
sc.exe config StargateSvc start= disabled 2>$null 1>$null
sc.exe delete StargateSvc 2>$null 1>$null
②管理员身份打开cmd命令行,进到如下2个目录执行uninstall.bat
cd /d "C:Program FilesQCloudStargateadmin"
cd /d "C:Program FilesQCloudMonitorBaradadmin"
如何验证已卸载?用sc qc命令查询服务情况,如果是指定的服务未安装就代表卸载了
sc.exe qc BaradAgentSvc
sc.exe qc StargateSvc
2、更改默认DNS导致内网域名解析异常,继而导致内网服务比如云监控异常、云镜异常等
https://cloud.tencent.com/developer/article/1878648
这里要特别注意,如果C:Program FilesQCloudStargatelogsstargate.log 有get uuid error的报错,要确保http://metadata.tencentyun.com/latest/meta-data/uuid得到机器的uuid
具体metadata.tencentyun.com对应哪个IP,访问如下2个URL,哪个能访问通,就在hosts里面指定哪个IP
http://169.254.0.23/latest/meta-data/uuid
http://169.254.10.10/latest/meta-data/uuid
169.254.0.23、169.254.10.10这2个IP,vpc机器都能访问,但是基础网络机器只能访问169.254.10.10。
3、重新安装云监控组件的话参考官网文档
https://cloud.tencent.com/document/product/248/6211