多模态人工智能正大步走向场景应用新阶段

来源:优秀文章 发布时间:2022-11-05 点击:

9月26日,以"共创产业智能新高度"为主题的多模态人工智能产业联合体第二次会议在武汉召开,会上发布了由中国科学院自动化研究所、武汉人工智能研究院、华为技术有限公司牵头的《多模态基础大模型技术白皮书》。

“当前,人工智能正从单模态、有监督学习,迈向多模态、自监督学习的时代。"中国科学院自动化研究所研究员、武汉人工智能研究院院长王金桥表示,"多模态人工智能的未来必将风光无限。”

要了解多模态人工智能,首先需要明白何为模态。一般来说,每一种信息的来源或者形式,都可以称为一种模态。人类在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。比如寻找花朵,一般人们会采取视觉、嗅觉等多模态的方式来进行。“某种程度上说,多模态的输入、输出方式正是人类智慧的重要体现之一。”王金桥表示。

目前的网络数据包括图像、视频、文字、音频等不同模态。对于人工智能来说,要想更好地掌握、分析、利用网络上的数据,就需要能够对这些多模态的数据进行系统的统筹和分析。王金桥表示:“技术创新是推动多模态人工智能产业发展的重要动力之一。自20世纪70年代多模态学习起步以来,伴随着近年来生成式预训练、基于Transformer的双向编码器表达等大规模预训练模型的快速涌现,人工智能研究领域正在经历一场有监督学习向无监督学习条件下‘大数据+大模型’的大规模预训练范式转变,多模态人工智能发展迎来了新的巅峰。”

近年来,多模态人工智能在场景泛化性、对数据的依赖性等方面都取得了巨大的技术突破。“多模态人工智能通过自监督的学习方式对海量无标注数据进行学习,同时面向特定任务场景进行小数据的标注学习和微调。相对于单模态人工智能,其对数据标注的依赖性降低了一个数量级以上。”王金桥说。

2017年,国务院制发《新一代人工智能发展规划》,由人工智能技术引发的产业变革正在加速演进。如今,多模态人工智能产业正大步走向场景化、实用化。目前,模型参数与数据规模不再是各研发机构的比拼重点,多模态人工智能产业正在走向场景应用的新阶段。例如,“全媒体多模态大模型”就是基于中国科学院自动化研究所“闻海”多模态媒体大数据和“紫东太初”三模态大模型的技术积累,结合新华社全媒体的海量数据积累和媒体融合业务场景而建立的。“全媒体多模态大模型”将加速推动人工智能在视频配音、语音播报、标题摘要、海报创作等多元媒体业务场景的应用。此外,在智慧城市、金融科技、民生服务等许多领域,多模态人工智能也有着广阔的应用场景。未来“多模态大模型+小模型”的模式或将成为多模态人工智能的主流,该模式可以有效解决需求碎片化、多样化等问题。

(内容来源:《科技日报》)

猜你喜欢 模态模型监督 自制空间站模型小天使·三年级语数英综合(2022年4期)2022-04-28什么是四个监督?党员生活·下(2020年5期)2020-07-04多模态话语理论在英语教学中的应用与前景探析读与写·教育教学版(2018年10期)2018-10-25模态可精确化方向的含糊性研究成长·读写月刊(2018年8期)2018-08-30模型小览(二)汽车导报(2017年5期)2017-08-03基于滑动拟合阶次和统计方法的模态阻尼比辨识技术计算机辅助工程(2017年3期)2017-07-13圆周运动与解题模型求学·理科版(2017年1期)2017-03-02离散型随机变量分布列的两法则和三模型中学生数理化·高二版(2016年4期)2016-05-14落实依法监督、科学监督、高效监督上海人大月刊(2015年8期)2015-09-10基于CAE的模态综合法误差分析计算机辅助工程(2012年5期)2012-11-21推荐访问:人工智能 大步 新阶段
上一篇:后疫情时代商业银行普惠型小微企业贷款业务风险管理研究
下一篇:基于CNN-RF的嵌入式数控系统故障诊断研究

Copyright @ 2013 - 2018 优秀啊教育网 All Rights Reserved

优秀啊教育网 版权所有