美摄科技受邀LVS2020大会 分享《AI合成虚拟人物的技术框架与挑战》
摘要:作为智能视音频解决方案解决方案的服务商,美摄科技致力于为移动互联网、智能手机、智能硬件、传统广电及通信运营商等行业机构提供最前沿的整体视音频解决方案,为开发者与行业合作伙伴提供高效、稳定的底层技术支撑,助力合作伙伴实现业务创新并创造巨大的用户价值。
2020年10月31日,LiveVideoStackCon 2020 音视频技术大会在北京丽亭华苑酒店举行,会议聚焦音视频技术与全球化、AI与多媒体处理、教育与多媒体、视频编解码、服务端开发优化、教育与多媒体等音视频技术与行业应用相关热点话题。汇集 500多位来自泛娱、教育、视频会议、社交、游戏、电商、金融、物联网等行业资深技术专家与顶尖学者共聚本次多媒体开发领域盛会。
会议中,北京美摄网络科技有限公司AI研究组负责人侯康先生受邀出席并分享主题演讲《AI合成虚拟人物的技术框架与挑战》,演讲内容从AI合成虚拟人物的技术框架出发,介绍了AI合成虚拟人物技术的背景,该技术通过输入一段文字,生成接近真实拍摄的主播视频。进一步详细介绍了AI合成虚拟人物不同技术路径之间的差异和优缺点,表情和口型预测模型的设计和优化思路,3D人脸重建和渲染技术、对抗生成网络,视频帧渲染和融合等关键技术。针对口型抖动和失真,GAN渲染结果中面部细节失真,最终视频的前后帧之间的平滑过渡等难点分享了解决方案。
美摄科技AI合成虚拟主播,将人工智能与计算机图形学相结合。当计算机获取语音或者文本中的内容信息后,即可通过计算机图形学合成技术对虚拟形象的面部进行驱动,渲染及融合,经过海量的面部数据进行生成对抗网络的训练,实现极具逼真感的表情还原,最终实现精细的唇音同步、表情姿态生动与真人无异的虚拟主播。在新闻播报、虚拟客服、互联网教学等领域有丰富的应用场景。
目前美摄科技的产品矩阵包括:视频高清拍摄及深度编辑SDK、智能视频生产服务平台、智能剪辑解决方案、智能手机解决方案、人脸+美颜/贴纸解决方案、云剪辑、虚拟主播、视频包装定制设计等服务。覆盖移动端、PC端、Web端,其从拍摄到编辑的全流程功能,实现当前所有主流视频的玩法。拥有灵活的技术架构,使用多线程和GPU、CPU协同预处理机制、自然语言处理演算法等技术,受到各行业的头部厂商一致认可,现与如小米、OPPO、ViVO、华硕、猎豹移动、哔哩哔哩、新浪、KEEP等各领域头部客户展开深度技术合作。并与国家电网、广电等传统企业合作,推动头条APP、融媒体在政企中的运用。除国内客户外,美摄科技也布局国外市场,在国际上填补海外市场智能视音频解决方案的空白。目前,已在美国、韩国、印度、新加坡等多个国家与当地互联网企业提供深度技术服务,辐射数千万海外用户,助力合作伙伴实现业务创新并创造巨大的用户价值。
相关文章:
相关推荐:
网友评论: