下一个十年,哪些技术将带来革命性的改变?
在一个新技术层出不穷的时代,对于这个问题,恐怕大部分企业与组织都在积极思考。
百分点技术副总裁兼首席架构师刘译璟博士认为,在产业数字化逐步深入的趋势下,以自然语言处理(NLP)、知识图谱为代表的认知智能技术将会以场景为切入点,通过以点带面、从局部到整体、层层推进的方式实现突破,从而为数字世界的交互与决策带来颠覆性改变。
百分点技术副总裁兼首席架构师刘译璟博士
为什么认知智能技术得到业界如此重视呢?这一切还得从数据开始说起……
//
数据信仰正在加速形成
//
尤瓦尔赫拉利曾在《未来简史》中预言:数据将成为人们未来的信仰。
现实情况中,企业与组织对于数据及其价值的认可度也在迅速提升。业界普遍认为,数据正在成为一种新型的生产资料,是未来企业/组织业务运转中不可或缺的要素。一位制造业企业CIO在向笔者谈到数据驱动业务时表示:“随着研发、制造、仓储、物流、服务等业务环节的数据全方位打通,为大数据、物联网、人工智能等技术的应用奠定了重要基础,智能制造已经不再是空想,未来将是数据进驱动业务。”
事实上,类似这样的企业不占少数。产业数字化和企业数字化转型的大浪潮下,基于数据的能力正在加速显现,并且得到越来越多用户的认可。就如IDG《2018中国企业数字化发展报告》中提到,企业在数字化转型过程中将逐步形成变革能力、敏捷能力、利用生态的能力、数字化产品与服务、数据资产化能力、经验数据化能力,这一切的基础就是数据。
刘译璟博士直言,用数据的角度去看待业务和现实,在观念上是一个巨大的转变,随着数字化程度越来越高,一个与物理世界相对于的数字世界在加速形成,并且物理世界与数字世界之间的交互会愈发频繁。因此,感知智能、认知智能等人工智能技术将会有巨大的用武之地,用户对于数据的信仰也将会加速形成。
//
从感知到认知:靠深度学习不够
//
众所周知,得益于算力大幅提升、数据愈发丰富以及以深度学习为代表的算法突破,以图像识别、语音识别为代表的感知智能技术近年来取得了突飞猛进的进步,并且在金融、零售、教育、安防、智慧城市等多行业与领域得到了应用。
不过,这还远远不够。
从技术发展的角度来看,从感知智能向认知智能是必然趋势,因为无论是图像中事物关系,还是语言中语义,都需要进行识别、理解,这恰恰正是认知智能技术正在努力解决的事情;从现实的角度来看,认知智能技术可以从海量数据中不断挖掘、提炼和汇聚知识,人们渴望有更深层次的认知,从而更好地了解客观世界。
在刘译璟看来,感知智能技术很快会在实际业务中遇到瓶颈,比如在语音识别中,如果只做文字层面的转换,而不能从认知层面去理解文本/文字的含义,那么对于用户的价值其实并不高;未来一定需要从认知层面去理解视觉中动作的含义、文字中语义与含义,从而了解业务变化并为决策提供支撑。“从数据到信息,再到知识,认知智能技术将发挥至关重要的作用。”
对于深度学习,刘译璟博士认为,深度学习技术的确是推动了感知智能技术的快速发展,但是仅仅依靠深度学习技术是远远不够的,深度学习是纯粹基于数据的方法,属于归纳的范畴,并不具有可解释性,在一定阶段后具有明显的瓶颈,从感知智能走向认知智能,仅仅依靠深度学习是远远不够的,还需要有更多突破。
//
认知智能:到底应该如何突破?
//
某种程度而言,认知智能技术的发展并没有像感知智能那样快速,依然有着众多挑战等待突破。
虽然近年来很多大公司在努力推动包括云计算、大数据、人工智能技术的发展,构建出系列技术平台,希望屏蔽掉底层技术的复杂性,推动包括认知智能技术在内的应用发展,但在实际业务场景中应用并未取得令人满意。
刘译璟直言,人工智能的变革需要场景应用来驱动。正所谓是,独立存在不是技术追求的目标,依托场景应用才是技术存在的真实意义。刘译璟认为,以知识图谱、自然语言处理为代表认知智能技术的确还有很多需要突破的地方,长期在行业场景实践中实现突破是最佳的方式。
对于任何一项新技术都不能在一开始就抱有不切实际的幻想。“不能过分夸大人工智能技术现阶段的能力,以自动驾驶位列,L5级别的自动驾驶现阶段的确是非常难实现,因为它要求机器在任何时候都比人做的好。但是我们可以先从一些特定场景中实现突破,继而逐步实现更多场景的应用。像自动驾驶在目前城市出租车、园区接驳车这些场景中就已经得到实现和突破。”刘译璟补充道。
“未来3-5年,认知智能一定会取得更多突破。”刘译璟表示,人工智能进入到中期之后,将会更多的下沉到各个行业之中,将会更多更加具体的业务场景,意味着专业化程度会更高,可用的数据也将更少,专家和方法的重要性会大幅提高。“像知识工程、语义分析这些认知智能层面的技术将再次兴起。”
在众多认知智能技术中,自然语言处理被认为是人工智能皇冠上的明珠,而知识图谱则被认为人工智能的基石,那么对于这两项重要的认知智能技术,未来又会有哪些具体挑战?
//
如何让自然语言处理绽放光芒?
//
物理世界与数字世界之间的交互与交流,自然语言处理技术是必不可少。
笔者认为自然语言处理一定会在未来得到更多发展和应用。某种程度而言,自然语言处理正在重新定义人与机器,物理世界与数字世界之间的交互方式,过去依靠屏幕、键盘的交互方式,会越来越多被语音、动作所取代,这时就需要自然语言处理来理解、判断和推理。
事实上,自然语言处理技术已经在不同行业的多项业务中得到了初步的使用,比如智能客服、智能翻译、智能机器人等。但是,从目前来看,大部分的应用的效果其实没有符合大众的期望值。业界也普遍认为,自然语言处理依然存在着很大的挑战。
百分点首席算法科学家苏海波博士认为,自然语言处理技术的突破的确是目前业界的巨大挑战。在他看来,挑战主要包括:带标识数据严重不足、文本迁移、文本推理、多模态融合的文本理解等等。“现阶段,没有通用的自然语言处理技术。自然语言处理四个层面主要为:形式、语义、推理和语用,现阶段自然语言处理在从语义到推理的阶段发展。”
苏海波博士介绍:“在语料足够丰富的场景下,比如智能问答、智能客服等,深度学习借助足够的场景标注语料,自然语言处理是可以达到不错的效果。但是百分点在大量实际客户场景中发现,用户面临最实际的问题就是如何在标注样本比较少的情况下,也能运用好深度学习技术,实现更佳的效果。”
根据苏海波介绍,业界目前的趋势是融合,希望利用融合来实现自然语言处理技术的突破,比如Google提出的BERT预训练语言模型,先去预先训练和学习很多知识,然后融入到语言模型中,再结合用户的具体场景,达到预想效果。“这种方式虽然标注样本较少,但是同样可以达到非常好的效果。”
百分点首席算法科学家苏海波博士
苏海波博士介绍,百分点目前也积极在一些客户的场景中采用这种思路去提升NLP效果,并且取得了非常不错的效果。“预训练语言模型类似迁移学习的思想,把之前的学习迁移到不同的场景中,这将在本质上突破NLP。”
“自然语言处理的突破指日可待,未来它的黄金时代即将到来。”苏海波博士表示。
//
知识图谱:认知智能的基石
//
如果说人工智能面临两大难题,一是人机交互,那另外一个就是行业知识、专家资源的匮乏。
这也是知识图谱的价值所在。所谓知识图谱,就是通过知识的关联性形成一个网状的知识结构,形成知识图谱的过程本质是在建立认知,理解世界、应用或业务。机器通过知识图谱可以更智能地从客观世界中获得知识,从而更加智能。
尤其是人工智能技术越往行业中下沉,越会面临着专业数据、知识匮乏的难题,缺乏相关训练的数据来源。刘译璟博士直言,传统机器学习都是归纳的方法。如果在一个新的领域,缺乏足够的数据将会面临冷启动的问题,这时候就必须需要人的经验和知识,将对业务的理解和认知告诉机器,这种对话就是知识图谱,当机器形成一定规模之后,就可以实现知识的共享。
“没有人工,就没有智能。”目前,通用性知识图谱已经逐渐构建成熟,而行业知识图谱则刚刚兴起。如何构建一套适合这个行业比较有使用价值的知识图谱,则必须借助业务专家。刘译璟表示:“在一个具体行业中,不可能像通用知识图谱那样去实现,必须借助业务专家,有了本体之后去对接数据和应用。”
去年,百分点提出了动态知识图谱的概念。刘译璟强调,动态知识图谱核心价值在于动态,即人对于业务的理解不是一层不变的,这种理解随时随刻都可能发生改变,动态知识图谱就是可以快速反应出人的这种认知变化。
//
下一个十年:从这场发布会开始!
//
作为国内企业级大数据 人工智能技术与应用服务商,百分点一直走在人工智能应用的最前沿,多年以来专注于大数据操作系统、智能认知产品以及智能决策应用场景的落地,并致力于大数据、人工智能技术在行业中的落地与应用,在大数据、认知智能技术积累了丰富的实践经验。