编者按:《国家科学评论》于2018年1月发表“机器学习”特别专题,由周志华教授组织并撰写文章。专题内容还包括对AAAI前主席Tom Dietterich的访谈,徐宗本院士、杨强教授、朱军博士、李航博士、张坤博士和Bernhard Scholkopf等人的精彩文章。
本文是周志华教授所做的特邀编者按,是对“机器学习”专题各篇文章的简介。本专题的更多翻译文章将陆续刊出。
机器学习:中国的最新进展与未来展望
作者:周志华
翻译:王培
校对:叶奎 宋平
“机器学习”这一概念是于1959年提出来的,但其被广泛引用的正式定义是在T. Mitchell于1997年编写的第一本关于机器学习的教科书中给出:一段计算机程序能够对以指标P度量性能的某类任务T,从经验E中学习并提升性能指标P。粗略而言,机器学习旨在使计算机能够通过从经验中学习来提高性能。而经验通常表现为数据样本,所以机器学习的主要关注点实际上是研究和构建学习算法,让其能够从数据中建立可预测或可描述的模型。随着对计算机数据分析需求的不断增加,机器学习变得越来越重要,并且促进了当前人工智能(AI)的大发展。
为了反映中国机器学习领域的最新研究进展及未来发展方向,《国家科学评论》(National Science Review, NSR)最近出版的机器学习专题报道了一系列针对最新技术的综述与观点、研究亮点和人物访谈。
在《关于图的学习表达》(Learning representations on graphs)一文中,朱军着重介绍了从以图表示的网络数据进行学习的最新进展。
在《模型驱动的深度学习》(Model-driven deep learning)中,徐宗本和孙剑介绍了他们的最新研究:尝试设计具有理论基础的神经网络拓扑结构,并使网络结构变得可解释、可预测。
在《面向自然语言处理的深度学习: 优势和挑战》(Deep learning for natural language processing: advantages and challenges)中,李航总结了自然语言处理的五大主要任务,并讨论了深度学习的优势和挑战。
“因果关系”(Causality)在解释、预测、决策等方面起着重要作用,因此从数据中学习因果知识是很有价值的。在《学习因果关系和基于因果性的学习》(Learning causality and causality-related learning)中,张坤等作者总结了他们在该方向上的最新研究进展。
张宇和杨强在《多任务学习概述》(An overview of multi-task learning)中,对“多任务学习”(multi-task learning)进行了概述。多任务学习旨在通过利用多个相关的学习任务中的有用信息来提高彼此的性能。
由于数据标注成本高昂,因此在许多任务中,人们需要进行弱监督学习。在《弱监督学习简介》(A brief introduction to weakly supervised learning)中,周志华就该方向做了简要综述。
专题的最后是对人工智能发展协会(AAAI,人工智能领域最负盛名的协会)前主席、国际机器学习协会创始主席Thomas Dietterich的访谈。访谈展现了机器学习领域激动人心的最新进展和技术挑战及其对世界的巨大影响。
周志华:南京大学计算机软件新技术国家重点实验室(National Key Laboratory for Novel Software Technology)教授。NSR专题特邀编辑(Guest Editor of Special Topic of NSR)
参考资料:
1. Samuel AL. IBM J Res Dev 1959; 3: 211–29.
2. Mitchell T. Machine Learning. New York, NY: McGraw Hill, 1997.
- 《国家科学评论》(National Science Review, NSR)是我国第一份英文版自然科学综述性学术期刊,定位于全方位、多角度反映中外科学研究的重要成就,深度解读重大科技事件、重要科技政策,旨在展示世界(尤其是我国)前沿研究和热点研究的最新进展和代表性成果,引领学科发展,促进学术交流。NSR的报道范围涵盖数理科学、化学科学、生命科学、地球科学、材料科学、信息科学等六大领域。基于科睿唯安发布的2016年度的期刊引证报告(Journal Citation Reports,JCR),NSR的最新影响因子达到8.843,稳居全球多学科综合类期刊的第五名(8%,Q1)。NSR发表的所有论文全文可以在线免费阅读和下载。
- 本文经《National Science Review》(NSR,《国家科学评论》英文版)授权翻译,“机器学习”专题的更多翻译文章将陆续刊出。