点击上方“图灵人工智能”,选择“星标”公众号
您想知道的人工智能干货,第一时间送达
文|毕颖
中国科学院院士徐宗本是数学与信息科技的交叉融合研究专家,为数学与实际应用的结合做出了重大贡献。他在应用数学、稀疏信息处理、机器学习、大数据与人工智能数学基础等领域,创造了系统性与原创性的成果。这些成果在雷达感知、CT成像、5G通信等多个领域得到了广泛应用。
今年,徐宗本院士接受媒体采访、演讲中,针对大模型、AI产业发展方向以及科学家应该如何面向国家重大需求凝练问题并形成凝练问题的机制,分享了他的思考与卓见。以下为徐宗本在公开报道中的观点的摘取。
01 大模型的本质是学习方法论
ChatGPT触发了AI大模型浪潮,人工智能研究已经从深度学习时代迈入了大模型(AIGC)时代,从聚焦专用人工智能转向到了通用人工智能。大模型的本质是学习方法论。学习方法论的本质要求是求对数据、网络、损失、算法、任务等要素作一体化的设计和调控。实现这一目标呼唤任务到方法的映照,即学习方法论的掌握(SLeM)),但现有研究/方法论不支持实现这一目标。1
02 AI思维
ChatGPT实现了以语言大模型为基础的认知智能、多模态智能的突破,在各行业有着广阔的应用场景,如文本生成与创意写作、信息检索、教育辅导等。不过,由于ChatGPT对大数据的依赖性,其在面对依赖实时感知才能完成的任务、不可解释机理的任务、无法标准化评价的任务时,就会显示出根本性的短板。利用AI技术来延伸和拓展人的功能,使现实生产力大大提升,正是人类面对时代变革应该具备的“AI思维”。3
03 人工智能的四个发展态势
人工智能的发展具有四个发展态势:第一,AI开源已渐成风尚;第二,AI成为科学研究新工具;第三,AI应用服务趋于工业化;第四,AI赋能经济势不可当,数据要素战略地位愈加突出。3
04 十大技术方向
重建分析基础、革新计算技术、劣实真伪判定是当前大数据面临的三大科学任务,区块链技术、互操作技术、存算一体的存储管理技术、大数据操作系统、大数据编程语言与执行环境、大数据基础算法、大数据机器学习、大数据安全技术、可视化与人机交互分析技术、真伪判定技术是当前十大技术方向。3
05 四条大数据原理及当前大数据现状
大数据有四条原理:
- 一是量变质变原理,即数据累积到一定程度,会突破某个临界点,这也是大模型“涌现机制”或“顿悟机制”背后的可能原因之一。
- 二是关联聚合原理,即不同模块的数据汇聚在一起,就可以拼出完整的拼图,产生放大价值。
- 三是分析致用原理,即需要通过分析,使原始数据转化成信息、知识、决策,这一过程至关重要。
- 四是效用倍增原理,即数据的可复制、可重用、可加工等特性使得数据价值倍增。
当前大数据发展的现状存在产能过剩与产能不足并存、数据开放共享进展滞后、盲从与观望并存、数据垄断与数据安全事件多发、人才储备严重不足、核心技术尚未突破、应用水平处在低位等问题。3
06 面向国家重大需求凝练问题
自由探索、目标驱动的基础研究与经济社会发展需要的应用研究并非割裂的,相反,扎实的基础研究会催生出源源不断的应用成果。比如将大数据应用于人工智能,需要对大数据进行研究,其本质就是数学的统计学分支,数学为大数据应用奠定了分析基础。
我刚工作时,研究方向是Banach空间几何,非常抽象,当时看很难应用。上世纪90年代正好掀起第二次人工智能浪潮,人工神经网络出现了。人工神经网络听着很神秘,其实就是用计算机模拟人脑神经结构,把它变成一个系统去解决问题,其底层就是数学问题。当时香港中文大学招募能做人工神经网络的数学专业背景研究者,我应邀做了两年研究,利用数学方法降低了人工神经网络的复杂性,发表了一批IEEE(电气与电子工程师协会)文章,这些工作引起了国内外同行的注意与好评。此后,我在西安交大和香港中文大学之间往返做了七八年研究,不断用数学理论解决人工智能发展中的一些问题。由此可以看到,数学作为基础研究的根本,一样能够推动应用研究领域的变革。而且只有更加深厚的基础研究土壤,才能生长出更多应用成果,二者相辅相成。
这些年来,我凝练的关键科学问题已经有十几个,都成为国家重大计划项目,包括大数据统计学、智能优化、人工智能与智慧医疗等。例如在智慧医疗方面,提出并探索了分布式微剂量CT技术。
CT是基础医检设备,虽已普遍使用,但其辐射剂量危害是其原理性缺陷,读片难是应用痛点。因此,CT的照射次数在一定时间内被严格限制,通常只在三甲医院部署,还难以作为医学筛查设备使用,难以在农村和社区部署,难以对国家的分级治疗战略与实践做出更直接的支撑。要把CT作为筛查设备,就必须解决CT扫描对人体的伤害问题。解决这一问题的唯一出路是使用低剂量甚至是微剂量的扫描方式。另一方面,想在农村、社区、移动环境下自由部署CT,最可能的方式是将CT的软、硬件分离,在农村、社区或移动端只部署“扫描”终端,而将成像和判读留在三甲医院(或专门的医学成像中心),扫描端与成像端通过5G通信联通。
受人工智能技术和科学计算原理的启发,我们形成了扫描—成像分离、用计算换剂量的解决思路。用计算换剂量,是一个数学问题,我们通过数学公式实现了微剂量扫描获得高分辨率成像,应用表明新的CT能够在1/10~1/5常规剂量下实施扫描并高精度成像。扫描—成像分离实现了CT在农村、社区自由部署,能够从设备上直接支撑和服务于国家的分级医疗战略与实践。以这些技术为基础的分布式微剂量CT已研发成功,形成了具有自主知识产权的国产新一代CT系统。新系统已在全国多地开展临床验证应用。2
07 探索关键科学问题凝练机制
现在问题的提出主要靠科学家的兴趣,这是不够的。当前需要高度重视凝练基础研究科学问题,形成凝练问题的机制。
十多年前,我们就在探索怎样凝练基础研究科学问题。为推动中国数学区域、领域均衡发展,国家自然科学基金委员会天元数学基金在全国设立了5个中心,我所在的是国家天元数学西北中心(下称“西北中心”)。西北中心建立之初,确立的主要任务就是凝练重大科学问题。我认为这是我们应该担负的责任。
凝练重大科学问题需要一种交流机制,便于进行知识的碰撞,在相互印证、相互启发中凝聚共识。西北中心每年聚焦1个主题,围绕主题组织重大专题研讨、重大交叉研究、前沿学术研讨、开办讲习班/暑期学校等多种形式的学术活动。从2019年到现在我们依次聚焦的主题包括:数据科学与医疗健康、偏微分方程与油气勘探、最优化方法与人工智能、随机分析与量化金融、图论与复杂网络。
例如,西北中心2022年的主题是随机分析与量化金融,我们围绕国家对数字经济发展和金融系统开放与发展中的总体安全需求,组织概率与随机分析、统计学、随机控制、数学与金融工程等学科专家,共同研讨金融与保险领域中的基本科学问题,这促进了学科交叉融合,打造高水平学术交流平台;搭建了校企合作桥梁。我们与金融企业深入研讨金融科技、风险管理、衍生品市场等,充分了解金融机构和实体产业对于金融风险管理的诉求,搭建创新合作的平台;通过主题年活动形成研究团队、开展攻关研究。西安电子科技大学、武汉大学组建团队,开展动态跟踪投资组合的优化、对冲与博弈问题研究,研究成果拟申报国家自然科学基金重点项目。
通过这些活动的密集研讨、集中攻关,将思想升华成问题,最终把选题变成国家任务。例如,2022年我们凝练了一批重大任务选题,形成了科技部重点研发计划“数学和应用研究”专项中的5个重大项目,证明西北中心组织的科学问题凝练工作是非常有效的。
搭建产学研融通平台也是推动凝练科学问题的重要方式。2020年,科技部在全国设立了十三家国家应用数学中心,西安交大牵头组建的陕西国家应用数学中心是其中之一。中心深入开展数学与其他学科的交叉研究,力求解决我国重点行业、重要领域发展中亟待解决的数学问题,我们关注的领域包含了非常规油气勘探的数学理论与反演方法、未来通信的数学技术、人工智能与数学的共融发展等。
在运行方式上,中心搭建产学研融通平台,推动数学家与企业、产业专家深入交流融合,发展领域中的共性关键应用数学理论与数学技术,为解决行业所面临的重大基础问题提供数学方法与数学技术。目前,中心已经与华为技术有限公司共建西交—华为数学技术联合实验室,与中石油东方地球物理勘探有限责任公司共建西安交大—东方物探数学与智能油气探测联合实验室,与陕西煤业化工集团有限公司共建陕煤5G 工业互联网联合实验室,与OPPO广东移动通信有限公司共建西安交大—OPPO数学与泛在软件体系联合实验室。中心与这些相关头部企业已经开展了实质性合作,率先探索了“数学家与行业技术专家在同一屋檐下”的合作模式。
中心实行“以质代量”与“静待花开”相结合的考核评价机制,以代表性成果、行业实际贡献、成果转移转化等进行综合评价。中心代表性成果包括提出了致密油气储层地震波超分辨反演和多维度表征技术,有力支撑了鄂尔多斯盆地的致密油气勘探开发。2
参考资料:
[1]扬子晚报网,专家:AI时代的统计与数据科学要以解决重大实践课题为导向[N]
[2]《瞭望》新闻周刊,徐宗本院士:凝练基础研究关键科学问题[N]
[3]21世纪经济报道,ChatGPT会取代人类?徐宗本院士谈AI的能与不能[N]
版权声明
版权属于原作者,仅用于学术分享
文章精选:
- 图灵和冯·诺依曼的遗产:生命计算机的架构
- 开源语言大模型演进史:高质量基础模型竞赛
- Open AI首席科学家:ChatGPT可能已经有了意识,AI将万世不朽
- 大语言模型真能“理解”语言吗?
- 李航:关于大模型的思考及研究热点
- OpenAI首席科学家:通向无监督学习之路
- Nature 封面:AI 改变科学的多种方式,无论是好是坏
- 智能计算领域10个重大科学问题
- 中国发表第一篇计算机顶会的人都怎么样了?中国ACL、AAAI、CVPR第一人是谁
- AI智能超越人类终破解!李飞飞高徒新作破圈,5万个合成数据碾压人类示例,备咖啡动作超丝滑