图片新闻释放“想象力” 让AI更加理解人类世界哈勃空间望远镜完成修复已恢复科学运行故宫门锁上也有黑科技通用AI平台 实现图文音“无缝转换”
第07版:科技创新·项目
上一版 下一版  
图片新闻
释放“想象力” 让AI更加理解人类世界
哈勃空间望远镜完成修复已恢复科学运行
故宫门锁上也有黑科技
通用AI平台 实现图文音“无缝转换”
     
 
重庆日报 | 重庆日报农村版 | 重庆科技报
重庆日报报业集团主办 
3上一篇  下一篇4  
2021 年 07 月 22 日 星期 放大 缩小 默认  

通用AI平台 实现图文音“无缝转换”

  新华社北京电 (记者 董瑞丰)从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。

  “小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所(以下简称“中科院自动化所”)研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。

  中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。

  “‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。

  据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。

3上一篇  下一篇  
 
《重庆科技报》版权所有 未经书面授权 不得复制或建立镜像
地址:重庆市渝中区双钢路3号科协大厦 邮编:400013
技术支持:北京北大方正电子有限公司