人群画像分析是对已经创建完成的人群进行画像分析,目的是从不同角度更深入地认识人群用户并挖掘其人群特点。
人群分布分析偏重人群画像标签值的占比分析,比如人群中男女占比分别为60%和40%;人群指标分析主要针对可量化的标签进行分析,比如人群的平均在线时长、平均点赞次数等;人群下钻分析是在某一画像分析维度的基础上再次基于其他画像维度进行分析,比如在人群男女分布的基础上,针对其中男性用户再次下钻分析其常住省分布;人群交叉分析是使用多个维度交叉计算其人群数据指标,比如通过性别和常住省交叉分析其在线时长;人群对比分析是对已经完成画像分析的多个人群进行分析结果对比,找出人群间的主要差异。
人群分布分析
人群分布分析是计算人群在画像标签上的分布占比数据,比如分析人群的性别分布,常住省分布,兴趣爱好分布等。从技术角度来看,分布分析适用于各类画像标签,但是从业务角度来看,有些标签的分布分析没有实际价值。比如对“每日在线时长”进行分布分析,如果其数据单位是毫秒,那么该标签的取值数量众多,分布分析计算出的分布结果很难被业务使用且不具有分析价值。由上可知,适合做分布分析的画像标签大多是可枚举且数量有限的标签,比如性别、年龄段、常住省、手机操作系统等;不适用标签值量级较大的标签,比如在线时长、粉丝数、新闻话题、历史阅读文章字数等。
人群分布分析结果可以通过饼图、环形图或者柱状图进行展示。饼图和环形图比较适合性别、年龄段等标签值数量少且不同标签值占比之和为100%的标签,通过这些图形可以明确展示各标签值的分布占比数据。柱状图一般适用标签取值较多、需要对标签值占比进行排序的标签,比如对城市标签进行分布分析(获取占比最高的前10个城市),对兴趣爱好(获取占比较高的头部兴趣爱好)进行分布分析。图6-3展示了人群分布分析功能示意图,图中通过饼图和柱状图展示了指定人群的性别和常住省占比分布。
对于自动更新人群,如果也需要定时计算其画像分布数据,那么使用该人群连续多日的分布分析结果可以构建出标签值占比变化趋势图。比如在某游戏的运营过程中,对于每天下载游戏的用户可以构建成定时更新人群,该人群更新后可以自动计算其性别占比分布。如果近一周男女占比趋势分析图中男性占比逐渐提升,那么后续可以重点分析男性占比提升的主要原因并调整运营策略。运营人员在某活动中为了吸引中老年用户采取了一系列补贴策略,通过观察活动参与人群年龄段分布趋势变化可以评估是否达到运营目的。
人群指标分析
人群指标分析用于计算人群在某些指标类标签上的数值及变化趋势。指标类画像标签的特点是可以量化并进行聚合运算,比如在线时长、粉丝数、充值金额,以上标签支持求和、平均、最小值、最大值等函数运算。人群指标分析结果具有很大的业务参考价值,比如人群平均在线时长可以反馈该人群的活跃情况,平均充值金额可以反映人群的消费意愿。
人群指标分析结果一般是单个数值,可以通过数字看板进行展示。指标分析也可以计算过去一段时间每天的指标数值并通过折线图展示其变化趋势,折线图中横坐标展示指标分析日期,纵坐标展示具体的指标分析数值。通过折线图中数值波动可以感知到人群指标变化;基于折线图数据可以实现数据报警功能,当数据波动超过阈值时可以发出报警信息。图6-4展示了人群指标分析功能示意图,其中展示了平均在线时长数字看板以及近一周平均充值金额指标变化折线图。
人群下钻分析
人群下钻分析可以增加分析的层次,由浅入深、由粗入细的进行人群画像分析。人群分布分析只能对人群进行最直观的画像分析,比如性别和常住省的占比分布。如果业务需要查看该人群中所有男性用户的常住省分布情况,那么需要深入到男性用户中进行更深层的画像分析。通过下钻分析功能用户可以更深入和细致地了解人群特点,比如某人群男女占比各50%,在男女用户基础上进行常住省下钻,其中男性下钻后占比最高的省份是山东省,女性下钻后占比最高的省份是河南省。这一分析结果可以反馈出该人群男女用户常住省信息有明显差异,而通过单一的人群分布分析很难得出上述结论。人群下钻分析结果也可以通过饼图、柱状图或者折线图进行展示,图6-5展示了某人群在性别基础上进行常住省下钻分析的功能示意图。
人群交叉分析
人群交叉分析可以选择多个画像标签维度,通过交叉计算不同标签值组合下的人群指标数据。相比下钻分析只专注某标签值的深入分析,交叉分析更偏重多维的全面分析,结果中包含所有维度组合后的分析数据。比如查看指定人群性别和常住省交叉计算后的用户平均在线时长,其分析结果包括性别男女和所有省份交叉组合后的人数占比以及平均在线时长数据。交叉分析的展示结果可以根据其数值大小呈现不同的颜色,从而快速区分并定位重点分析结果。图6-6展示了某人群基于性别和常住省的交叉分析示意图,其中北京男性用户模块颜色最深,代表该人群下北京市男性用户平均在线时长最大,具有显著的特点。
人群对比分析
人群对比分析通过对比两个人群的画像分析结果,可以找出人群间的主要差异。人群对比分析可以利用人群分布分析结果进行计算,假设两个人群A和B都计算出了性别分布数据,其中A人群男女占比分别是60%和40%,B人群男女占比分别是70%和30%,将两个人群的占比环形图放到一起便可以对比出人群间的主要差异。
为了量化不同人群之间的画像分布差异,可以引入TGI指数进行计算,其计算公式为(目标人群中具有某一个特征的人群比例)* 100 /(对比人群中具有该特征的人群比例)。如果计算出的TGI数值等于100,说明两者之间没有任何差异;当TGI数值与100差距越大时说明两者的差异越明显,也可以侧面反馈出人群的主要特点。TGI计算公式中的对比人群一般指全量用户人群,目的是找到人群与大盘用户的主要差异;也可以把任何其他人群当成对比人群,主要目的是找到任意两个人群之间的显著差异。还是以人群A和B为例,其中男性用户的TGI = (60% / 70%)*100 = 85.7,表示人群间男性用户占比有微弱的差异。图6-7展示了两个人群进行人群对比分析的功能示意图,图中展示了性别和常住省下的所有TGI数值,其中女性和河南省具有显著差异。
本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。