数智洞见 | 你买基金了吗?聊聊标签画像在基金行业的应用

2021-12-07 14:28:13 浏览数 (1)

近几年,基金市场火热,相关话题频上微博热搜,相信基金选购话题也经常出现在大家的聊天话题里。基金相对股票来说低风险,且交易频次易控制,已成为新手理财或稳健理财的头号选择,我们作为购买者,会比较基金的短期、长期收益率、单位净值、基金经理的经验等来选择投资。同时,基金公司也会建设客户画像,为每个购买者推荐基金,在此之间,数据作为桥梁打通购买者的需求与售卖者的营销策略,互惠互利。

今天我们来看下基金行业的客户画像是如何搭建的。

一、基金行业的标签建设需求

金融科技的快速发展,使得资管行业的载体与社交媒体、电子商务融合越来越紧密,企业需要借助数据战略打破数据边界,来构建更为全面的企业营销全景视图。以袋鼠云数栈产品和某基金客户在智能标签上的合作为例。

对基金客户来讲,随着各项业务迅猛的发展和客户数量的急速增长,公司对客户、产品、渠道、反洗钱等方面的数据分析、统计、运营提出了更高的要求。但客户主要面临以下2点问题:

(1) 客户等数据分散于各个系统,无统一的分析平台;

(2) 各类数据分析和提取大多采用半自动的工作模式,无科学的标签体系及资源共享平台提供及时和有力的支持,导致客户信息维度不完整,客户活动开发周期长,运营不精准,营销效果缺乏及时追踪、运行反馈不及时等。

鉴于以上痛点,及更好的适应并支持现实业务的需要,建立客户自己的标签系统。

具体建设目标

  • 建立涉及客户、产品、渠道的三层标签体系,支持销售、服务、合规等不同角度的需求;
  • 支持便捷的标签开发、运算、展示和输出等全生命周期管理,持续输出数据价值;
  • 支持客户个体及群组画像、客户群圈选和对比,支持快速推广、智能营销、精准服务;
  • 细粒度的标签权限管理和高效稳定的标签展示和输出,确保安全且高效的业务开展;
  • 积木式的组件标签搭建和复用,可快速支持例行、临时或专题性的数据分析。

二、基金行业标签建设方案

1. 建设方式

智能标签标准产品(DataTag) 标签体系梳理与开发

2. 技术方案

标签建设一般会包含“数据读取-标签加工-标签更新-标签评估-标签圈群-客户/群组画像-群组分析-数据服务”,其间涉及到技术选型如下:

  • 数据存储:采用Hive进行数据存储;
  • 分析引擎:Presto
  • 标签计算与查询:Presto读写Hive;
  • 标签/群组对外服务:API查询HBase;
  • 数据同步插件:袋鼠云自研批流一体数据同步插件FlinkX;

以下是标签建设通用方案与该项目具体方案:

标签建设通用方案

某项目技术架构

a.计算集群对接:智能标签产品采用的OLAP引擎是Presto,并有Presto的二次开发能力,如Presto的公开插件中没有Inceptor的连接器,袋鼠云便自研该插件完成Presto对Inceptor的读写,进行标签的加工与查询。DataTag之前也已适配过Cloudera的CDP产品,支持对接Apache Hadoop集群以及发行版Hadoop。

b.标签周期与手动跑批:

(1) 采用presto读写Hive数据进行标签大宽表的加工,最终将所有标签放在一张大宽表中,从而提高标签圈群与群组分析的效率;

(2) 标签除根据选择的调度周期定时跑批外,可进行手动更新,且手动更新时产生一个新的秒级分区,以解决业务人员想即加工标签即用的场景,不影响其他人员圈群的需求。

c.标签圈群:通过Presto查询标签大宽表进行目前群组圈选,并让用户选择群组数据是否要落库和定时更新。

d.数据服务:标签和群组的对外服务,通过数据同步或数据API来完成。

(1)通过数据同步工具,将存在Hive的标签表、群组表同步至其他数据库,在其他应用平台应用。

(2)创建API服务,通过API接口调用标签或群组数据。会将Hive的结果表同步至HBase,API查询HBase数据库,具有查询速度快、存储数据量大、可解决Presto并发量不高问题等优点。

3. 产品方案

对应以上建设目标,产品解决方案如下:

a.多实体与关系建模

基于“多实体”设计,实现可创建基金行业中客户、产品、渠道多个对象的标签体系;并可通过“关系”将多实体进行关联,创建基于多个实体原子标签的衍生与组合标签。

b.[原子标签/规则标签/SQL标签/算法标签/组合标签]多维标签生成

可将数仓ETL加工的原子标签直接读入。用DataTag中设置规则标签与SQL标签的加工规则,“求和、去 重计数、计数、最大值、最小值、均值、排序”等聚合函数、子查询、连接操作符、多层且或关系均可支持,灵活加工出目标标签。同时通过算法平台加工算法标签,并将算法标签的元数据读入DataTag进行标签统一管理,实现标签的便捷加工与运算。

标签加工方式灵活多样,业务人员也可直接介入规则类标签标签加工,可随时修改标签规则。且标签创建完成后,可立即进行标签更新,让业务人员立即使用,提高生产效率。

c.标签全生命周期管理

从标签定义-标签开发-标签发布-标签更新-标签评估-标签下线,管理标签全生命周 期,各过程可管可控,统一标签管理规范、沉淀企业核心标签资产,形成企业统一的标签中心。

d.个体画像、群组画像、群组对比、群组显著性分析等优化标签体系与群组投放

(1)个体画像:根据实体用户标识,查询单个实例的实体画像,如某用户的用户画像,帮助运营人员 更加直观的了解用户,助力精准营销。

(2)群组画像:自定义画像模板,从不同维度分析群组特征,掌握群组画像,为目标群组 的选择与营销策略的投放提供参考。

(3)显著性分析:通过 TGI 指数计算群组的显著性特征,挖掘群组偏好,提升增长、 赋能业务。

(4)群组对比:同一实体下的不同群组进行相似性与差异性分析,查看群组特征,进行群组优化。

e.数据权限细粒度精致,保障数据安全

(1) 标签可见性控制:通过标签发布时控制可见用户组,实现部分标签只对部分人员可见,形成部门或个人的标签池。

(2) 标签读写列权限控制:发布某标签(后续进行标签加工),使用某标签(标签圈群和分析时使用)都需要经过部门管理员、项目管理员审批,严格控制标签的查询、加工操作。

(3) 标签行级权限控制:针对用户设置标签的可读行级权限,比如负责直销售基金的部门,只能查看渠道是“纯直营自销“客户的标签数据,不可见“代销“渠道的客户数据。

(4) 标签脱敏:针对敏感标签(如身份证号、电话号码等)可进行部分人员脱敏,数据查询或分析时,展示脱敏后的数据。

通过标准化的产品方案,解决客户无统一标签分析平台、标签半自动化加工、加工周期长等痛点。

4. 标签体系设计

按照标签建设方法论和数仓模型,从基金客户的基本属性数据、交易数据、持仓数据、基金产品数据、用户行为数据等多方面数据,建设出基于以下标签类目的200 标签,每天定时跑批加工。

基于以下划分标准,采用不同的标签类型,在不用平台完成标签加工。

  • 原子标签:既定事实,从原始数据中提取,比如性别、生日等信息;
  • 衍生标签:没有对应数据,需要定义规则,由原子标签来计算得出标签实例,比如区间类;
  • 组合标签:没有对应数据,需要定义规则,多种类型标签来计算得出标签,比如偏好类;
  • 算法标签:参考已有事实数据建立算法模型,来预测用户的行为或偏好;
  • 实时标签:基于业务系统数据实时更新标签数据,比如基于埋点数据设计的标签;
  • 自定义标签:通过自定义sql的形式完成标签数据萃取;或手动打给用户的标签。

三、标签在基金行业的应用场景

基于建设好的标签,业务人员便可透明化的使用标签,将数据库的黑盒子变成业务语言的白盒子,辅助业务决策,驱动业务增长。标签在基金行业主要应用于以下场景:

新基金推广

当新基发行时,会进行一定的营销活动,向用户推广。如新基金首先会面向直销自营、偏爱新基金、活跃客户、不具有反洗钱特征等的用户推送,先圈定一部分用户,然后再结合客户的交付风格、持仓风格圈定优选客群。推送一批客户后,可再基于首轮命中客群的相似人群进行补充推广,是一个持续迭代的营销过程。

互联网营销

面向个人的基金推荐,如债券型基金一般推送给有过购买债券型基金行为、购买潜力高的客户;根据用户偏好进行千人千面的金融资讯推送,丰富用户理财知识;基于用户的投资时长,推送不同理财阶段的投资课程等。

异常交易监控

根据用户风险类标签,找到短期内频繁开立账户、撤销账户、频繁交易、交易IP跨境、交易时间异常的客户,进行重点防范与预警,保障金融安全。

用户流失预警

根据客户活跃度、交易周期、账户余额区间、盈利情况等标签,找到静默用户,进行触点激活。

后续数栈智能标签产品将会采用算法进行人群圈选,补充业务规则圈群的局限性,以及基于实时标签人群的实时推送方面进行进一步探索,使业务营销更加精准、高效。

0 人点赞