李海军 2021年的跌宕起伏,数据不再是神秘的词语,瞬间进入普通大众的生活。疫情的常态化,让我们认识到出行大数据;赴美上市企业的数据泄漏事件,让我们理解了数据安全;电商杀熟,让我们认识到数据的无良;外卖小哥的送餐路径规划,让我们折服于人工智能的效率;突如其来的元宇宙,让我们憧憬数据未来的美好。
我任职于爱驰汽车,一家新势力造车企业,致力于智能科技服务用户。过去的一年,我们主要在做数字化转型,解决业务系统数据资产化,进而推动一些业务场景数据驱动。
数据价值,始终是我必须思考的问题,数字化推进的进程中,每一个场景我都会问自己:业务流程是否必要固化;是否需要全部数据;数据会带来哪些价值;数据是否安全可追溯;数据可共享依赖等等。业务是流程化的,时序性的解决具体场景问题;数据则无法立即产生业务价值。这不是一个简单的是和非的问题,从长远的角度看,数据记录了业务过程,保留了场景要素,必要时可以模拟,可以进行挖掘分析,产生新的业务价值。数据研发和业务研发,应该是一个协同作业的过程,研发过程需要同步设计推进。
元宇宙带给我们的不仅仅是一个概念,它是一批成熟技术的重新组合,这将会为我们带来一种全新的体验。元宇宙元年已来,2022年的大数据技术将会有新的价值输出,数据资产将更加贴近用户,为用户场景输出价值。我将结合多个行业数据在元宇宙中的应用,来说明大数据技术未来可能发生的变化:元宇宙基础建设;智能虚拟化工厂;用户虚拟化;数据资产安全;数据多元化权属及交易;数据资产开放共享。
元宇宙基础建设,离不开空间世界的构建。我们日常出行所使用的导航地图,街景地图,商场等室内电子导览图等等都是空间数据。在我们的国家,测绘局、国土局有不同比例精度的空间数据,可以生成全国三维地图,按照行政区划等级生成城市、社区、厂区等三维地图。城市规划,房产部门有建筑物类的空间数据,相同的技术方法,可以生成更加真实的建筑物室内三维图形。这些三维数据,目前属于国家机密数据,需由国家授权才可实施采集、更新、发布,我们普通公民是无法做此类工作的。
假如有一天,我们的生存环境更加的自由开放,一些普通群体也可以从事空间数据工作,数据的更新将更加及时准确。
智能虚拟化工厂的构建,需要单位自己将工厂车间布局进行三维构建。目前已经有一些公司,采用视频设备将建筑物内部空间快速三维实景构建。产线设备的构建,则依托于企业自己产线设计图纸数据,生产设备构建设备,基于BIM方法进行三维构建。虚拟工厂的构建,空间坐标的精度要求,根据工厂自身需求可以自由掌握。厂房结构具有空间位置坐标,我们在构建虚拟化工厂时,通常会采用相对坐标,取建筑物某点为坐标原点,一方面方便计算,也利于用户理解。
用户虚拟化,我们要了解自己。我们首先要了解自己的形象,为了更加真实的展现自己,元宇宙中希望更加真实的虚拟化自己,稍作化妆美化下自己也是可以的。只要我们自己愿意提供足够真实的体形特征数据,目前的技术要想高保真的渲染出来,应该不是难事。现实世界中的我们,不同时间应该会经常移动,我们又如何在虚拟的世界中展示出来。这就需要我们的实时出行数据,包括我们基于LBS技术的设备数据。
假设,我们能够获取这些数据,自己的虚拟化形象也就被真实的构建出来了。真实的世界,时空坐标定位下是独一无二的,而在虚拟的世界我们可以有一个物理世界完全相同的镜像,也可以构建某些特殊意义的场景。在数据上,我们就要构建更加复杂的模型来适应这种多元化的场景诉求。
数据资产安全是大数据领域非常核心的技术问题。元宇宙的到来,数据资产的使用更加灵活,场景更加复杂多变,不仅要处理物理镜像数据的一致性,还要做到虚拟数据的多层数据安全。数据的溯源能力,相比现实世界将显得更加重要。物理世界,多种设备的数据采集,首先要安全可靠,然后要做到准确传输、防篡改。身份识别、认证,在数据资产安全问题上发生频率将大幅度增加,目前的安全技术变得非常脆弱,有可能催生出大批新的安全技术。
数据多元化权属及交易,数据资产所有权问题在虚拟世界里将无法回避,交易将是一种正常行为。元宇宙基础建设空间地理数据,数据由政府采集管理,权属应归政府所有;空间地理数据,数据量非常之大,同样是大数据范畴,应该由政府大数据中心进行管理维护。
智能化虚拟工厂数据包括企业生产数据由企业构建所形成的资产,权属应该属于企业;企业应有自己的大数据中心来管理维护这些企业资产数据,或者由企业租用公共数据中心来维护。用户虚拟化所产生数据,权属应该属于个人所有,但个人几乎不具备建立或管理自己数据资产的能力,这样很可能将会诞生一些被政府授权企业,帮助用户管理个人数据资产,也有可能出现一个像户籍管理这样的政府数据中心帮助管理。数据的管理需要费用成本,数据的转移交换也会产生交易成本。
在元宇宙的世界里,数据资产的交易一定是核心的、高频发生的问题;技术上的难题也一定很多,如果区块链技术可以解决,除了要解决交易效率问题,复杂度同样是需要攻克的难题。虚拟世界的物理镜像,都可以参考物理世界规则执行,也是我们目前最容易考虑到的问题。
数据资产开放共享,在元宇宙的世界里,数据资产的共享是不可缺少的。如此庞大的元宇宙世界,数据不是某个政府或者企业可以独立完成的,多形态的大数据中心间的数据共享尤为重要。假如忽略技术复杂性,我们单从数据共享的可能性考虑,需要多级政府,诸多企业间建立起统一的数据交换标准,建立起实时的共享机制。数据资产要想做到共享,一定会遇到权属确权,共享授权等复杂技术问题。
最后,我以爱驰汽车用户的场景为例,描述元宇宙的世界是怎样的体验。柔性生产场景:爱驰用户A,在线选择车辆配置及个性化配件,并提交订单;智能工厂立即收到订单信息,由订单BOM信息,确定排班排产,场内物流将个性化配件送往产线,就这样一辆个性化的订单,从冲压、焊装、涂装到总装,30分钟后下线;爱驰用户A的虚拟形象A’,早已经等候在车间,逐个跟随着产线上现场观看汽车的生产过程,整车下线,开心地通知爱驰用户A。爱心交车场景:爱驰用户A现场交车后回家,老婆B在家焦急等待着;爱驰用户A开心的行驶在城市道路上,虽然偶尔有些堵,但丝毫不影响开心的心情,时而玩辅助驾驶跟随模式,时而玩起语音车控;老婆B的虚拟形象B’,将爱驰用户A的炫技全过程转投到家里电视上,老婆B不再焦急,和家人一起乐起来了;过了几天后,爱驰用户A和老婆B分享给朋友C提车场景,打开电视,按照时间、地点等条件回放,当时真实的三维画面,展示在朋友C面前。
元宇宙的最终实现,必将是一个漫长、复杂的技术蜕变过程,短期可能在特殊领域技术突破。个人的浅薄理解,希望能够帮助到大家理解元宇宙,也希望能够有所启发,探索大数据领域新技术。
关于李海军:
爱驰汽车首席数据官、资深技术专家,负责大数据建设,推动数据驱动、智能服务商业化建设。
滴滴出行高级技术专家,具有丰富的出行领域数据产品服务经验。早期车联网产品专家,数据产品专家。