【国际模式识别大会ICPR18】纯金干货!周志华等6场特邀报告和论文最全回顾

2018-09-25 15:41:38 浏览数 (1)


新智元推荐

来源:中国科学院自动化研究所

作者:紫冬君

【新智元导读】第24届国际模式识别会议(ICPR 2018)上周在北京成功举行,这是40多年来该会议首次在中国大陆举行,凸显了中国在模式识别这一AI重要子领域的地位及国际认可。

作为模式识别领域的旗舰学术会议,国际模式识别大会(ICPR)自1972年起,每两年召开一次。在2014年国际模式识别大会的理事会全体会议上,中国和澳大利亚围绕2018年国际模式识别大会举办权展开了激烈角逐。

中国科学院自动化所模式识别国家重点实验室学术委员会主任、中科院院士谭铁牛和实验室主任刘成林代表中国作申办报告并回答了理事会的质询,最终赢得理事会青睐。这折射了我国改革开放40年来在模式识别这一人工智能重要领域的快速进展,代表了国际学术界对于主办方模式识别国际重点实验室学术能力的充分认可。

模式识别是人工智能的关键技术之一,使机器通过视觉信息识别文字、图片和周围的环境,通过听觉信息识别与理解语言。在大数据时代,传感、通讯、数字化技术等手段使得信息内容的智能识别与理解成为信息科技发展的新的重大契机。

本届会议由国际模式识别联合会、中国自动化学会、中国科学院自动化研究所联合主办,对于我国在国际人工智能学术领域而言,具有重要的历史意义,不仅是其创办40多年来第一次在中国内地召开,同时我国高校和企业的入选论文占了总入选论文的半壁江山,凸显出我国在该领域日益崛起的重要学术地位

2018年的ICPR分为6个主题,包括模式识别和机器学习、计算机视觉、语音图像视频和多媒体、生物识别技术和人机交互、文档分析和识别以及生物医学成像和生物信息学。除了口头报告和海报展示,大会还邀请到6位该领域的顶尖学者做特邀报告,展示该领域最新研究成果。

大会主席谭铁牛院士致辞

程序委员会主席刘成林研究员致辞

大会的开幕式上,大会主席谭铁牛院士和程序委员会主席刘成林分别致辞。在持续4天的主会中,共举行了9场全体会议,包括3场颁奖演讲及6场特邀嘉宾报告。

2018年的ICPR在筹备阶段便获得了极大的关注。根据会议官方网站的数据,今年,ICPR共收到1258篇有效投稿,投稿量略高于ICPR 2016。经过严格的审稿,一共有652篇论文被接收(接收率为52%),其中口头报告125篇,海报展示527篇。

在参会人数方面,今年的参会人数达1000人左右。根据参会者的“爆料”,近千人规模的会场在8月20日签到时早早排起了长龙。

同样是在官方宣布的数据中,我们看到,2018年产业界的参与数量众多,全球共有13家企业赞助本次大会,分别包括百度、阿里巴巴、科大讯飞、联想、三星、慧听数据、杜比实验室、英伟达、中科唯实、银河水滴、虹星科技、中科虹霸及马上科普。

3 大人物奖项揭晓

其中,来自芬兰奥卢大学的Matti Pietikäinen教授、德克萨斯大学奥斯汀分校Kristen Grauman教授、意大利摩纳德大学Rita Cucchiara教授分别荣获由国际模式识别联合会颁发的King Sun Fu奖、J. K. Aggarwal奖以及Maria Petrou奖,并就各自研究领域作精彩的大会报告。

芬兰奥卢大学的Matti Pietikäinen教授获得King Sun Fu奖

德克萨斯大学奥斯汀分校Kristen Grauman教授获得J.K. Aggarwal奖

意大利摩纳德大学Rita Cucchiara教授获得Maria Petrou奖

其中,模式识别领域的最高奖项King Sun Fu奖得主Matti Pietikainen教授在颁奖演讲中分享了其研究团队在人脸分析与情感AI方面的一系列研究成果,包括情感与动态人脸表情识别、基于局部二进制 (LBP) 算法的图像和视频描述、心率测量、可视语音识别和多模态情感分析等内容,以及面部表情分析可以应用于情绪识别、情感机器人、顾客体验分析、在线教育、疼痛强度预估、审讯、价格谈判、心房颤动等多个行业场景。

Matti Pietikainen表示,目前情感AI领域的研究仍然处于初级阶段,未来挑战的研究方向有卷积神经网络二值化 (Binarized CNNs)、常规算法和卷积神经网络混合等。

6 场特邀报告:涵盖模式识别及3D视觉基础、深度学习与移动驾驶应用、人类智能与AI未来研究方向

2018年的ICPR分为6个主题,包括模式识别和机器学习、计算机视觉、语音图像视频和多媒体、生物识别技术和人机交互、文档分析和识别以及生物医学成像和生物信息学。

除了口头报告和海报展示,大会还邀请到6位该领域的顶尖学者做特邀报告,展示该领域最新研究成果,分别在当地时间 22 日、23 日和 24日举行。

报告主题涵盖模式识别及三维视觉基础,深度学习与移动驾驶应用,以及人类智能与人工智能未来研究方向,为为期一周的大会奠定了基调。

中国香港科技大学权龙教授

权龙教授是中国香港科技大学计算机科学与工程系的终身正教授,同时也是中国科学院自动化研究所——中国香港科技大学智能识别联合实验室共同主任。

他在题为“The Challenges of 3D Reconstruction with Deep Learning”的演讲中,回顾了以往计算机视觉和视觉学习的发展历程,并重点介绍他近期的深度视觉学习工作和计算机视觉的3D重建突破等工作。

美国福特汽车公司高级技术主管K. Venkatesh Prasad

美国福特汽车公司高级技术主管K. Venkatesh Prasad是福特移动出行领域的高级技术负责人,也是福特全球技术顾问委员会成员,曾任福特的全球创新执行主管。在题为“Automobiles and Mobility Solutions”的报告中,K. Venkatesh Prasad 概述了机器智能在应用程序中的一些关键应用领域。

微软公司全球副总裁毛建昌

微软公司全球副总裁毛建昌在题为“Achieving Human Parity Performance in Pattern Recognition and Language Understanding by Machines”的演讲中,简要介绍了微软在图像识别、语言理解、机器翻译等任务上实现人类平等的历程和实现突破的技术。同时,他还将介绍深度学习的一些应用,比如OCR (光学字符识别) 在无约束环境和广告中的应用。

谷歌研究科学家Ashok C. Popat

谷歌研究科学家Ashok C. Popat在题为“Advice to a Promising OCR Researcher”的演讲中,介绍了谷歌开发OCR系统中关于文档分析和识别方面的想法。

南京大学周志华教授

南京大学人工智能学院院长周志华教授在题为“An Exploration to Non-NN Style Deep Learning”的报告中,讨论深入学习的要点,并证明它不一定是由神经网络实现的。并对非NN风格的深度学习进行探索,说明其中构建模块是不可微分的模块,训练过程不依赖于反向传播。

英国牛津大学Alison Noble教授

英国牛津大学教授Alison Noble在题为“Human Intelligence, Artificial Intelligence and How They Are Changing Ultrasound Image Analysis”演讲中,介绍了其带领的团队在机器学习应用于超声图像分析方面的最新进展,以及针对这个应用领域的一些有趣的挑战和新兴的研究热点。

6 篇最佳论文和 6 篇最佳学生论文奖

除了精彩的颁奖演讲及特邀嘉宾报告,本届大会还进行了29场共计125份口头报告以及4场共计527份海报论文展示,并为12篇论文分别颁发了ICPR 2018最佳论文奖和最佳学生论文奖。

最佳论文奖

Track 1: Zhang, Zhihong; ZHOU, DA; Xu, Chuanyu; Wang, Beizhan; Wang, Dong; REN, GUIJUN; Hancock, Edwin. Depth-based Subgraph Convolutional Neural Networks.

Track 2: Zhang, Jiyuan; Zeng, Gang; Zha, Hongbin. Scalable Monocular SLAM by Fusing and Connecting Line Segments with Inverse Depth Filter.

Track 3: Hao, Jiedong; Dong, Jing; Wang, Wei; Tan, Tieniu. Deep Firearm: Learning Discriminative Feature Representation for Fine-grained Firearm Retrieval.

Track 4: Xu, Qin; Sun, Yifan; Li, Yali; Wang, Shengjin. Attend and Align: Improving Deep Representations with Feature Alignment Layer for Person Retrieval.

Track 5: Riba, Pau; Fischer, Andreas; Llados, Josep; Fornés, Alicia. Learning Graph Distances with Message Passing Neural Networks.

Track 6: Dhara, Ashis Kumar; Arvids, Erik; Fahlström, Markus; Wikström, Johan; Larsson, Elna-Marie; Strand, Robin. Interactive Segmentation of Glioblastoma for Post-surgical Treatment Follow-up.

最佳学生论文奖

Track 1: Xu, shan; Zhang, Xiao; Liao, Shizhong. A Linear Incremental Nystrom Method for Online Kernel Learning.

Track 2: Antensteiner, Doris; Štolc, Svorad; Pock, Thomas. Variational Fusion of Light Field and Photometric Stereo for Precise 3D Sensing within a Multi-Line Scan Framework.

Track 3: Perera, Pramuditha; Mahdi, Abavisani; Patel, Vishal. In2I: Unsupervised Multi-Image-to-Image Translation Using Generative Adversial Networks.

Track 4: Sindagi, Vishwanath; Patel, Vishal; Di, Xing. GP-GAN: Gender Preserving GAN for Synthesizing Facesfrom Landmarks.

Track 5: Jolly, Shailza; Iwana, Brian Kenji; Kuroki, Ryohei; Uchida, Seiichi. How do Convolutional Neural Networks Learn Design?

Track 6: Lopez-Martinez, Daniel; Peng, Ke; Steele, Sarah; Lee, Arielle, Arielle; Borsook, David; Picard, Rosalind. Multitask multiple kernel machines for personalized pain recognition from functional near-infrared spectro scopy brain signals.

(本文转载自中国科学院自动化研究所,转载时有改动,编辑:闻菲)

0 人点赞