日前,由腾讯主办的年度技术盛会2020Techo Park开发者大会于北京顺利召开。本次大会邀请了200多位海内外专家和数千位参会者就人工智能、多媒体等前沿技术话题展开交流。
作为腾讯旗下顶尖科技实验室,也是全球多媒体技术的领先者,智慧媒体是腾讯多媒体实验室的重点研究领域之一。腾讯多媒体实验室总监李松南表示,近期多媒体实验室推出了AI媒体内容生产平台——智慧媒体,可以通过搭建基于跨模态(图像、音频、文本、语音)算法的多媒体内容分析和理解框架,实现媒体标签、分类、检测、摘要、内容描述等功能。
李松南用“无中生有”“浴火重生”和“斗转星移”三个词来形容智慧媒体的内容生产方式。所谓“无中生有”是指从0到1,从无到有的创作过程,比如给AI模型一些随机的噪声信号,AI模型可以生成一首诗或一段钢琴曲。“浴火重生”即同模态间的转化,比如输入一段音乐,输出也是一段音乐,只是弹奏这段音乐的乐器发生了变化,比如从钢琴变成了琵琶。“斗转星移”是指不同模态之间的匹配或转化,比如视频与音乐之间的互相匹配、图片与文字之间的相互转化等。
截至目前,腾讯智媒的媒体内容生产能力已覆盖12种技术能力,部分能力已在腾讯云上的产品进行应用。