有时候在做简易日志分析的时候,需要从特定的日志记录中提取特定的信息
信息提取
假如有如下错误日志,我们需要提取shopId和orderNo
代码语言:javascript复制{"@message":"[2021-08-04 00:10:00.756][scheduling-1][ERROR][ProfitSharingCrontabManager:235][maibao-transaction][b0dab5d4eaa9e063]: fail to request profit sharing: order[ProfitSharingFinishOrder(id=15668, buyerId=11862667, shopId=406924, subMchid=1547072391, orderNo=MBORDER0080011608448, transactionId=4340800671202019714263, outOrderNo=MBPROFIN00700118042, wxOrderId=null, closeReason=null, finishAmount=null, status=NEW, deleted=0, finishTime=null, createTime=2021-07-28T16:41:28, updateTime=2021-07-28T16:41:28)]ncom.tencent.maibao.transaction.WxException: 对同笔订单分账频率过高n
代码语言:javascript复制grep -F "fail to request profit sharing" all.log | grep "ProfitSharingCrontabManager:235" > log.dat
代码语言:javascript复制sed 's/.*shopId=([0-9]*).*orderNo=(MBORDER[0-9]*).*/1 2/g' log.dat
- 2'. 使用扩展正则表达式(选项
-E
)
sed -E 's/.*shopId=([0-9] ).*orderNo=(MBORDER[0-9] ).*/1 2/g' log.dat
正则表达式不同之处
sed默认正则表达式
- 不支持d
- 不支持 (表示1个或多个)
- 捕获组的圆括号,需要转义
- 替换组,使用反斜杠
1
,其他地方大部分都是美元符号$1
sed扩展正则表达式
- 不支持d
- 替换组,使用反斜杠
1
,其他地方大部分都是美元符号$1