最近要新开一个项目,配个 logger 来管理日志吧,我配!
代码语言:javascript复制import logging
ori_logger = logging.getLogger('custom_logger')
ori_logger.setLevel(logging.INFO)
ori_logger.addHandler(logging.StreamHandler())
ori_logger.info('learn log')
# learn log
Emmm... 感觉日志丑丑的,NOT GOOD。为啥不试试 mmcv 的 get_logger 呢,功能齐全,一步到位。呐~链接拿去:
https://github.com/open-mmlab/mmcv/blob/master/mmcv/utils/logging.py
终端日志
代码语言:javascript复制mmcv_logger = get_logger('mmcv_logger', log_file='a.log')
mmcv_logger.info('learn log')
# 2022-03-24 10:38:35,998 - mmcv_logger - INFO - learn log
日志文件
代码语言:javascript复制2022-03-24 10:37:25,832 - mmcv_logger - INFO - learn log
太方便了!时间戳、日志名、日志等级,甚至还贴心地为你保存了日志文件,一行代码轻松搞定。
mmcv 的 get_logger 到底是是如何配置出如此便利的 logger 的呢?只需要配置 logger 三宝:日志等级(loglevel)、格式控制器(formatter) 和 日志处理器(handler),让 logger 对你言听计从。
logging 之日志等级✦
logging 模块的日志等级如下:
代码语言:javascript复制CRITICAL = 50
FATAL = CRITICAL
ERROR = 40
WARNING = 30
WARN = WARNING
INFO = 20
DEBUG = 10
NOTSET = 0
Logging.Logger(本文中的 logger 为其实例)和 logging.Handler 的 level 属性,就表示对应实例的日志等级。当我们调用 logger.info(msg) 和 logger.warning(msg) 时,输出的消息也有日志等级。只有当消息的日志等级大于等于 logger.level 时,日志才有可能被输出。以我们上一期《是谁偷偷动了我的 logger》中提到的 logging.root 为例:
代码语言:javascript复制import logging
logger = logging.root
print(logger.level) # 30, warning。root 日志等级为 WARNING (30)
logger.info("info msg") # 日志等级为 INFO (20),小于 WARNING,无消息
logger.warning("warn msg") # 日志等级为 WARNING (30),输出消息 warn msg
logger.error("erro msg") # 日志等级为 ERROR (40),输出消息 erro msg
logger.setLevel(logging.ERROR) # 设置日志等级为 ERROR (40)
print(logger.level) # 40, ERROR
logger.warning("warn msg") # 无消息
logger.error("erro msg") # erro msg
logging.root 的日志等级为 WARNING,因此无法输出 INFO 级别的消息。当我们把日志等级调整成 ERROR 后,则会无法输出 WARNING 级别的消息。但是奇怪的是,第一期中我们提到,logging.root 默认情况下是一个胚胎,本身不具备输出日志的能力,为什么这里仍然能够输出 warning 和 error 级别的日志呢?这里先留一个疑问,在 Handler 一节会给出答案。
logging 之 Handler✦
在解答上一节提出的问题之前,让我们回顾一下第一期的内容,既然 logging 模块是通过 Handler 来输出日志的,本节就先介绍 logging 模块的两大 Handler:streamHandler 和 fileHandler。
StreamHandler
向终端输出信息
配置了 StreamHandler 的 logger,可以和 print 一样向终端输出日志信息,示例如下:
代码语言:javascript复制logger = logging.root
# 创建 streamHandler
stream_handler = logging.StreamHandler()
# 设置日志等级
logger.setLevel(logging.INFO)
logger.info("learn logging") # 没有配置 Handler,终端不会输出日志
# 为 root logger配置 Handler
logger.addHandler(stream_handler)
logger.info("learn logging") # 配置 Handler,输出日志
向文件输出日志信息
实例化 StreamHandler 时,如果 stream 配置成写入的目标文件,就能将日志存储到文件中。
代码语言:javascript复制f = open('output.txt', 'w')
logger = logging.root
logger.setLevel(logging.INFO)
stream_handler = logging.StreamHandler(stream=f)
logger.addHandler(stream_handler)
logger.warning("learn logging") # 此时 learn logging 会被写入到 output.txt 中
f.close()
FileHandler
FileHandler 继承自 StreamHandler,可以指定写入文件的编码格式,相比于 StreamHandler 更加灵活,易于使用:
代码语言:javascript复制logger = logging.root
logger.setLevel(logging.INFO)
# 设置输出文件和编码方式
file_handler = logging.FileHandler('output.txt', encoding='utf-8')
logger.addHandler(file_handler)
logger.info("WARNING") # 此时 learn logging 会被写入到 output.txt 中
Handler 的日志等级
Handler 也有自己的日志等级。一条消息想经过 Handler 输出,需要同时满足消息的日志等级大于 logger 的日志等级和 handler 的日志等级。
代码语言:javascript复制logger = logging.root
logger.setLevel(logging.DEBUG) # logger 的日志等级为 DEBUG
handler = logging.StreamHandler()
handler.setLevel(logging.INFO) # handler 的日志等级为 INFO
logger.addHandler(handler)
logger.debug('learn logging') # 不满足 handler,无法被输出
logger.info('learn logging') # 同时满足 logger 含 handler,正常输出
logging 的暗箱操作
没有 handler 也能输出日志?
首先讲结论,logger 在没有 handler 的情况下,其本身是不具备输出消息能力的,streamHandler 的第一个例子已经说明了这个问题。但是为什么 logger.warning(msg) 和 logger.error(msg) 能够在不配置 handler 的情况下,输出日志呢?这其实是 logging 模块的保护机制,对于 warning 和 error 级别的消息,如果消息的日志等级大于 logger 的日志等级,且 logger 没有配置任何的 handler,则会调用 logging 模块内置的 streamHandler 来输出信息。
为了证明这个逻辑,我们给 logger 配置一个 fileHandler,此时 logger.warning(msg) 就不会在终端输出日志了。
代码语言:javascript复制logger = logging.root
logger.warning("learn logging") # 输出日志到终端
file_handler = logging.FileHandler('output.txt', encoding='utf-8')
logger.addHandler(file_handler)
logger.warning("learn logging") # 不会输出日志到终端
坑爹的 logging.xxx
当你开心地调用 logging.info,logging.warning 时,你以为只是输出了一条日志,实际上可能给 logging.root 偷偷配置了 streamHandler。
代码语言:javascript复制logging.info('learn logging')
print(logging.root.handlers)
# [<StreamHandler <stderr> (NOTSET)>]
你可能会想,就多了个 streamHandler 嘛,这有啥。还记得被多重日志支配的恐怖么 。为什么使用 pytorch 1.10 突然出现了多重日志?追根溯源,是因为 pytorch 1.10 的 DistributedDataParallel 模块在 forward 过程中调用了 logging.info (https://github.com/pytorch/pytorch/blob/71f889c7d265b9636b93ede9d651c0a9c4bee191/torch/nn/parallel/distributed.py#L874),进而 logging.root 多出了一个 streamHandler(该过程发生在 mmcv.get_logger 之后,handler 的日志等级没有被设置成 ERROR),最终导致多重日志的发生。
logging 之 Formatter✦
如果说配置 Handler 相当于教 logger 说话,那么为 handler 配置 formatter 就相当于教 logger “优雅” 地说话。
给日志加上“主语”
我们可以通过配置 formatter,让 logger 输出的日志自带 logger 名。
代码语言:javascript复制logger = logging.root
handler = logging.StreamHandler()
handler.setFormatter(Formatter('%(name)s - %(message)s'))
logger.addHandler(handler)
logger.setLevel(logging.INFO)
logger.info('learn logging')
# root - learn logging
这样输出的日志就会自带 “root” 日志名。
给日志加上时间
小学语文老师肯定教过,时间地点人物是七要素的前三甲,时间更是位居榜首,因此我们可以通过配置 formatter,让日志携带时间信息。
代码语言:javascript复制logger = logging.root
handler = logging.StreamHandler()
handler.setFormatter(Formatter('%(asctime)s - %(name)s - %(message)s'))
logger.addHandler(handler)
logger.setLevel(logging.INFO)
logger.info('learn logging')
# 2022-03-22 01:36:42,900 - root - learn logging
给日志加上等级
日志等级可以凸显日志的重要性,例如我们会特别注意携带 ERROR 字段的日志。因此我们可以通过 formatter 让日志携带等级信息。
代码语言:javascript复制logger = logging.root
handler = logging.StreamHandler()
handler.setFormatter(Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s'))
logger.addHandler(handler)
logger.setLevel(logging.INFO)
logger.info('learn logging')
# 2022-03-22 01:46:26,667 - root - INFO - learn logging
欸,有那味儿了,是不是和 OpenMMLab 系列的日志如出一辙?实际上 mmcv 配置 logger 的过程也是类似的,并且还有着更加全面的 handler 配置逻辑:mmcv/logging.py at master · open-mmlab/mmcv (github.com),大家可以参考借鉴哈。
小结✦
理解 loglevel、handler 和 formatter 的概念后,我们自己也可以动手写一个简易版的配置 logger 函数。
代码语言:javascript复制def custom_get_logger(name, out_file, log_level):
# 设置日志名
logger = logging.getLogger(name)
# 设置日志登记
logger.setLevel(log_level)
# 设置格式
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s'
' - %(message)s')
# 配置输出日志到终端的 Handler
stream_handler = logging.StreamHandler()
stream_handler.setFormatter(formatter)
# 配置保存日志到文件的 Handler
file_handler = logging.FileHandler(out_file)
file_handler.setFormatter(formatter)
# 添加 Handler
logger.addHandler(file_handler)
logger.addHandler(stream_handler)
return logger
custom_logger = custom_get_logger('custom_logger', 'a.log', 'INFO')
custom_logger.info('learn log')
# 2022-03-24 11:18:52,120 - custom_logger - INFO - learn log
通过 custom_get_logger 接口获取的 logger,日志格式好看,也能存储到本地备份,基本和 mmcv 对齐。不过这样配置的 logger 还存在一些隐患,例如上期提到的多重日志。要想解决这些问题,我们不妨再回过头去看 mmcv.get_logger 的代码,相信经过这一期的学习,很多逻辑就变得容易理解。
至此 logging 模块的基本功能就介绍得差不多了,但是 logging 还存在一些隐式的暗箱操作,如果想彻底搞懂 logging 模块,敬请期待下一期的内容~