作者|Nature
出品|AI机器思维
当前借助大数据技术,针对当前新冠肺炎疫情防控需要生成的健康码成为随身数字“通行证”,方便广大市民及进(返)各城市查询自身防疫相关健康状态的识别码,即便捷了防疫检查,也真正实现了大数据技术的价值应用,便捷服务市民。健康码的应用也让大数据更形象的普及推广,更深刻的理解了大数据的价值。
时代变迁,当前人类进入万物互联的智能时代,地球村的时代,交流频繁。数据价值应用凸显,实现数据的智慧化应用成为各行各业的利器。企业、产品、业务、人等都可以借助数据画像从而更深刻的理解企业经营情况、产品使用情况、业务经营情况、人的健康状况等,依靠数据决策,依靠数据提供的参考,更科学更智慧。
随身数字“通行证”健康码的数据收集是最关键的,打通各系统之间数据壁垒,实现数据互联互通,全面的数据才能更全面的反应人的健康情况。对于防范病毒而言,在没有疫苗的情况下,采取古老的隔离方式,人们不在流动,饿死病毒,阻断病毒传播链条成为当前科学防疫的策略。
随着疫情的基本阻断,根据健康码数据情况,对地区采取风险分级的应用成为复工复产,指导人们尽快走向正常的生活,既便捷了防疫又避免了防疫的复杂手续化,最大可能降低企业和人的经济损失成为当前大数据利用的价值发挥。
01
什么是健康码画像?
如果没有疫情,健康码这个标签名称不会这么火,健康码目前是方便人流通的随身数字“通行证”,利用收集到的移动数据、高铁数据、飞机数据、位置数据等对人防疫进行画像,根据医学观察条件,生成不同的健康码,如红色的健康码表示需要隔离观察,绿色的健康码可以自由通行等。
从另一个角度而言,人从出生就可以对其健康数据进行收集分析,生成人的身体健康指标码,从而提前预防疾病,避免未老先衰。一切皆可预防。
健康码画像让普通大众理解了数据,其实在实际的应用中还有很多针对特定场景的画像,如用户画像、产品画像、业务经营画像等,下面以用户画像为例讲解。
02
什么是用户画像?
用户画像可以理解成利用数据生成用户特征的标签,如根据用户的基本属性、消费购物、行为和交际圈等给予用户画像,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予其标签名称,给予用户打标签,同时基于一些人口统计学要素、场景等描述,形成一个用户画像原型。如下图的用户画像。
简单的来说用户画像等于自我介绍,比如:刘小名,33岁,巨蟹座,从事中医工作,购物达人,类型多偏技术和管理,喜欢甜食,但对海鲜过敏,目前还是单身狗一只等等。
通过这个用户画像,从而对这个人有了一个整体的认识,一个完整的人物画像已经呈现在了你的脑海里。当标签被描述得越多,用户画像就越清晰。
03
用户画像的意义
1)从企业层面而言,识别目标客户特征、测试客户潜在需求。用户画像可以帮助企业进行精准营销、市场洞察、预测市场需求,从而帮助企业高层决策,辅助制定阶段性目标,提升ROI;同时更有助于避免同质化,进行个性化精准营销。
2)从产品本身角度而言,用户画像可以帮助提升客户体验。围绕产品进行客群细分,确定产品的核心客群,从而有助于确定产品定位,优化产品的功能点。
3)从数据角度而言,用户画像有助于建立数据资产,挖掘数据的价值。使数据分析更为精确,甚至可以进行数据交易,促进数据互联互通的流通。
用户画像的基本要素包括:基本属性、动态属性、消费属性、行为属性和心理属性等。
基本属性是勾勒用户画像的基础:性别、年龄、学历、角色、收入、地域、婚姻等。
动态属性是指用户在移动互联网上的网络行为、消费偏好、娱乐偏好、社交习惯、出行方式以及获取知识的方式,这些都直接反应了用户对产品的内容是否感兴趣。
消费属性是指用户的消费倾向、消费区间、消费心理等,这反映的是用户对花钱有什么看法。到底是喜欢质量好的还是追求品质高的,是倾向于产品功能价值还是情感需求的价值。
心理属性是从用户潜在的心里需求分析,从生活、工作、情感、社交等方面所拥有的价值观。
04
构建用户画像的具体步骤
1.数据收集:对各系统数据进行梳理、采集,实现基础数据的互联互通,从而为用户画像做数据准备。数据的来源可能来自多个系统,各系统开始是隔离的,需要加工处理整合。如客户管理系CRM,或者有智能采集系统日志的工具,收集方式包括API、SDK和传感器采集等,根据数据分析与数据挖掘什么标签来反推需要的数据源。
2.数据清洗:数据清洗是对原始数据源存在“脏数据”如数据空缺和噪声、不一致、重复、错误等问题进行特殊化处理加工的过程,为了保证后期数据分析与数据挖掘的准确性,避免对决策造成影响,须对原始数据进行数据清洗预处理。
3.数据标准化:用户画像需要整合多源甚至跨系统的数据,如客户可能使用多个设备,拥有移动网络的多个账号,需要把同一个身份ID组合,建立统一的标准,才能完整标识实体的用户画像。
4.用户·建模:借助算法模型来定义客群的用户画像,如分类模型、聚类模型,常用的算法如朴素贝叶斯、决策树、SVM,神经网络,k-means等。
5.标签挖掘:利用云计算、大数据和人工智能技术,通过系统平台来进行标签的加工和计算,借助平台进行训练和学习,大规模的并行计算,挖掘用户标签。
6.标签验证:通过真实案例验证标签挖掘结果的正确性,保证标签对应的处理结果跟预期大体相符。即可以先用小样本数据验证模型的可靠性,再依照结果进行调整,再进行挖掘。
7.大数据可视化:借助大数据可视化技术,通过大屏实现视觉效果,呈现群体或个人的用户画像。
如下图对一个美食店的经营情况的用户画像,从而掌握了此店的经营情况,为未来发展提供决策依据。