一直有各种事情,很久没更新了,趁春节空档继续更新,分享一个线上疑难问题的排查过程
在某个版本上线后,这个异常的量突然变大了,log如下
通过log,可以知道是imageview使用了被回收的bitmap导致的,可以具体看下崩溃地方的源码
android.graphics.BaseRecordingCanvas$drawBitmap
frameworks/base/graphics/java/android/graphics/BaseCanvas$throwIfCannotDraw
崩溃的原因,是很清晰的,就是使用的bitmap被回收了,由于log只有系统层级的log,没有项目的log,那该如何进一步定位呢?
可以分成三个步骤
1、定位发生错误的activity
崩溃是发生在draw方法内部,draw方法一般都是在当前Activity可见的时候触发,就是onResume跟onPause的生命周期中,我们可以在崩溃后台,标记最新可见的activity,当发生崩溃时候,把当前可见的activity一起上报,可以通过后台查看,崩溃那一刻,在前台的是哪个activity
可以连续查看几条,看下是否都是同个activity,我这边验证,崩溃的信息,都是固定的一个activity,于是可以基本确定,崩溃是发生在这个activity
2、定位错误的view
定位到activity,范围还是太大,我们接下来进一步缩小,定位到具体的view,具体是哪个imageview崩溃
可以在崩溃堆栈入手,发现view的onDraw方法,调用其实就是view的布局一步步调用下来的
通过上图的分析,可以知道崩溃imageview的布局层级关系,用图表示如下
可以通过activity的布局,定位到符合这个布局层级关系的imageview
到这里应该可以基本确定异常的imageview了,如果还不行,继续看步骤3
3、准确定位异常imageview 如果上面的两个步骤,还是无法定位修复问题,可以继续看
比如发现有多个imageview都满足条件,如何进一步定位到具体崩溃的是哪个imageview 可以用如下的方式,替换下所有怀疑的imageview
代码语言:javascript复制class BitmapRecycledImageView(context: Context, attrs: AttributeSet?) : GlideNoFlickerImageView(context, attrs) {
var drawException: RuntimeException? = null
override fun onDraw(canvas: Canvas?) {
try {
super.onDraw(canvas)
} catch (e: RuntimeException) {
//代表bitmap被回收了,发送到bugly,用于后续定位分析
//错误的log大概这个样子:image bitmap Recycled com.meitu.meitupic.modularembellish.filter.ActivityFilter@76184c8 imageID 2131298607,可以方便定位到问题
if (drawException == null) {
//onDraw是个高频调用的场景,只上报一次就可以了,避免大量的上报
drawException = RuntimeException("image bitmap Recycled $context imageID $id")
CrashReport.postCatchedException(drawException)
}
}
}
}
这样的话,当发生错误后,就触发上报,收集上报的log,收集到的log类似如下
代码语言:javascript复制image bitmap Recycled
com.meitu.meitupic.modularembellish.filter.ActivityFilter@b24f0b7
imageID 2131298604
com.mt.material.filter.BitmapRecycledImageView.onDraw
(BitmapRecycledImageView.kt:30)
定位到了发生崩溃的activity,包括错误的imageview的ID
接下来,通过imageview id找到具体的imageview
我们知道,我们在xml中给每个view定义的ID值,其实都会被编译成一个16进制的值,而这个值跟我们代码定义的值有一个映射关系,可以通过解析apk来获取
Log上报的ID值是十进制的,转成16进制后,就是:0x7f09092c,跟apk的资源比对,找到对应的value值
这样就知道了具体崩溃的imageview
最终发现,出现问题的是因为外部应用了Glide加载的bitmap
接下来,就是分析,为什么会出现这个崩溃,由于涉及到Glide缓存模型,放下个章节继续说明,待续...