MongoDB运维与开发(7)---MongoDB监控

2020-11-26 11:27:57 浏览数 (1)

//

MongoDB运维与开发(7)---MongoDB监控

//

MongoDB中自带两个监控的工具,分别是mongostat和mongotop,今天我们看看这两个工具的使用方法。

mongostat

mongostat工具提供了mongod和mongos的运行状态和数据,可以从mongostat工具的执行结果中获取如下信息:

代码语言:javascript复制
[root@VM-0-14-centos ~]# mongostat --port=27018 -u "yeyz" --authenticationDatabase "admin" -p "123456"     
insert query update delete getmore command dirty used flushes vsize   res qrw arw net_in net_out conn           set repl                time
    *0    *0     *0     *0       0    14|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.66k   83.8k   22 sharding_yeyz  PRI Nov 19 11:42:08.431
    *0    *0     *0     *0       0    13|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.93k   71.7k   22 sharding_yeyz  PRI Nov 19 11:42:09.434
    *0    *0     *0     *0       0    12|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.39k   70.5k   22 sharding_yeyz  PRI Nov 19 11:42:10.433
    *0    *0     *0     *0       0    13|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.93k   71.8k   22 sharding_yeyz  PRI Nov 19 11:42:11.433
    *0    *0     *0     *0       2    15|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  3.72k   74.0k   22 sharding_yeyz  PRI Nov 19 11:42:12.432
    *0    *0     *0     *0       0    13|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.93k   71.8k   22 sharding_yeyz  PRI Nov 19 11:42:13.432
    *0    *0     *0     *0       0    11|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.39k   70.4k   22 sharding_yeyz  PRI Nov 19 11:42:14.433
    *0    *0     *0     *0       0    14|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.98k   72.6k   22 sharding_yeyz  PRI Nov 19 11:42:15.434
    *0    *0     *0     *0       0    15|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  2.06k    137k   22 sharding_yeyz  PRI Nov 19 11:42:16.431
    *0    *0     *0     *0       3    17|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  6.47k   77.0k   22 sharding_yeyz  PRI Nov 19 11:42:17.432
insert query update delete getmore command dirty used flushes vsize   res qrw arw net_in net_out conn           set repl                time
    *0    *0     *0     *0       0    14|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  2.23k   73.1k   22 sharding_yeyz  PRI Nov 19 11:42:18.432
    *0    *0     *0     *0       0    16|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  2.49k   73.7k   22 sharding_yeyz  PRI Nov 19 11:42:19.431
    *0    *0     *0     *0       0    11|0  0.5% 0.6%       0 1.41G 59.0M 0|0 1|0  1.39k   70.2k   22 sharding_yeyz  PRI Nov 19 11:42:20.435

这里有必要将其中的某些关键列说明一下:

insert、query、update、delete 分别代表每秒的操作次数

getmore代表当前批量查询得到的文档个数,如果查询的文档多,mongodb会自动批量查询

command代表primary和secondary的节点指令个数,如果是在从库上执行,则代表从库执行的命令数据以及复制从库的其他实例的命令执行情况,二者通过|分割。

dirty代表wiretiger存储引擎的缓冲中脏字节的百分比。

used代表已经使用的wiretiger存储引擎缓存比例

flushed对于wireTiger存储引擎,表示触发检查点的次数;对于MMAPv1存储引擎,表示当前将数据写入磁盘的次数

vsize:程序应用的虚拟内存大小

res:当前已经使用的物理内存量,单位为Mb

qrw:等待读取的文档个数与等待写入的文档个数

arw:正在执行的读取文档个数与正在执行的写入文档个数

net_in|net_out 进出的网络流量

conn:当前连接数

需要注意的是mongostat是一个持续输出的命令,只要我们不手动终止,它会一直运行,输出到屏幕上。

mongotop

相比mongostat,mongotop输出的内容有限,来看下面的例子:

代码语言:javascript复制
[root@VM-0-14-centos ~]# mongotop --port=27018 -u "yeyz" --authenticationDatabase "admin" -p "123456"    
2020-11-19T11:53:22.898 0800    connected to: 127.0.0.1:27018


                                        ns    total    read    write    2020-11-19T11:53:23 08:00
                         admin.system.keys      0ms     0ms      0ms                             
                        admin.system.roles      0ms     0ms      0ms                             
                        admin.system.users      0ms     0ms      0ms                             
                      admin.system.version      0ms     0ms      0ms                             
config.cache.chunks.config.system.sessions      0ms     0ms      0ms                             
            config.cache.chunks.test.test0      0ms     0ms      0ms                             
            config.cache.chunks.test.test1      0ms     0ms      0ms                             
                  config.cache.collections      0ms     0ms      0ms                             
                    config.cache.databases      0ms     0ms      0ms                             
                    config.system.sessions      0ms     0ms      0ms  

ns,集合名字

total:读写花费时间(单位是ms)

read:读花费时间

write:写花费时间

mongotop输出的内容表示每个集合的每个表读写情况,它打印了每个库里面读写花费的时长,单位是ms,可以帮助快速定位读写瓶颈。

mongotop这个命令只运行一次,如果想每间隔一段时间,就运行一次,则可以使用:

mongotop 30

这样的写法,可以让mongotop命令每30s运行一次,这样可以持续的检测mongodb的运行状态。

除了这两个工具之外,还有一些其他的命令可以查看集群的状态:

db.serverStatus()

db.stats()

db.collStats()

rs.status()

下面分别解释这几个命令。

db.serverStatus()

这条命令会列出MongoDB的整体情况,包含主机名字、版本、进程、连续运行时间、连接状态以及操作状态。因为它显示的结果比较长,这里我们只说说常用的几个信息:

host:主机名字

version:MongoDB版本

process:PID进程号

uptime:主机的运行时间

asserts:MongoDB启动后报警的统计数量

connections:MongoDB的连接统计信息

network:MongoDB的网路情况

storageEngine:存储引擎信息

mem:当前使用的内存信息

db.stats()

该命令显示的是db的信息,没有server层面的信息,我们解释下下面db的意思。

代码语言:javascript复制
> db.stats()
{
        "db" : "admin",
        "collections" : 3,
        "views" : 0,
        "objects" : 6,
        "avgObjSize" : 306.5,
        "dataSize" : 1839,
        "storageSize" : 106496,
        "numExtents" : 0,
        "indexes" : 5,
        "indexSize" : 139264,
        "fsUsedSize" : 38917517312,
        "fsTotalSize" : 52709240832,
        "ok" : 1
} 

db:代表当前数据库的名称

collections:当前数据库中集合的数量

view:当前数据库中视图的数量

objects:当前数据库中所有文档的数量

avgObjSize:数据库中文档的平均大小

dataSize:当前数据库的数据大小,单位是byte

storageSize:当前数据库占用硬盘空间的大小,单位是byte

numExtents:当前数据库中所有集合Extents扩展的数量统计

indexes:当前数据库中的索引数量

indexSize:当前数据库中的索引代销,单位是byte

fsUsedSize:当前MongoDb所在的硬盘已经使用的空间大小

fsTotalSize:当前MongoDb所在的硬盘总共的空间大小

ok:1表示成功,0表示失败

db.coll.stats()

这个函数返回的是集合的状态信息,由于输出的内容很多,这里我们仅说明重要的几个部分:

代码语言:javascript复制
> db.yeyz.stats()
{
        "ns" : "test.yeyz",
        "size" : 115,
        "count" : 3,
        "avgObjSize" : 38,
        "storageSize" : 36864,
        "capped" : false,
        "wiredTiger" : {
                "metadata" : {
                        "formatVersion" : 1
                },

ns:当前集合的名称

size:当前集合的大小,单位是byte

count:当前集合的文档数量

nindexes:当前集合中索引的数量

totalIndexSize:当前集合中所有索引的大小,单位是byte

rs.status()

这个函数是用来查看副本集中的成员的状态信息,如下:

代码语言:javascript复制
yeyz_repl0:PRIMARY> rs.status()
{
        "set" : "yeyz_repl0",
        "date" : ISODate("2020-11-20T15:35:12.386Z"),
        "myState" : 1,
        "term" : NumberLong(46),
        "syncingTo" : "",
        "syncSourceHost" : "",
        "syncSourceId" : -1,
        "heartbeatIntervalMillis" : NumberLong(2000),
        "optimes" : {
                "lastCommittedOpTime" : {
                        "ts" : Timestamp(1605886492, 1),
                        "t" : NumberLong(46)
                },
                "readConcernMajorityOpTime" : {
                        "ts" : Timestamp(1605886492, 1),
                        "t" : NumberLong(46)
                },
                "appliedOpTime" : {
                        "ts" : Timestamp(1605886502, 1),
                        "t" : NumberLong(46)
                },
                "durableOpTime" : {
                        "ts" : Timestamp(1605886502, 1),
                        "t" : NumberLong(46)
                }
        },
        "lastStableCheckpointTimestamp" : Timestamp(1605886462, 1),
        "members" : [],
        "ok" : 1,
        "operationTime" : Timestamp(1605886502, 1),
        "$clusterTime" : {
                "clusterTime" : Timestamp(1605886502, 1),
                "signature" : {
                        "hash" : BinData(0,"C8IXyxh/1zCqWtwxI1mfMgq9DAE="),
                        "keyId" : NumberLong("6891183663887679489")
                }
        }

下面对常用的字段进行描述:

set:副本集的名称

date:当前的时间

myState:当前副本集节点的状态

term:副本集的选举数

syncingTo:从哪个副本集同步数据,如果这里是空值,则代表当前副本是primary

syncSourceHost、syncSourceId分别代表同步目标节点的host和id值

heartbeatIntervalMills:副本集心跳频率,单位为ms

optimes:副本集同步的进度信息

lastStableCheckPointTimestamp:列出最近的检查点的时间。

members:列出副本集中每个成员的信息数据。

0 人点赞