基于语义空间统一表征的视频多模态内容分析技术

作者：张德; 王子玮; 张峰语义空间多模态视频

摘要：视频是数据处理中综合性能最高,包含内容最广的载体。视频题目通过文字表达,内容通过连续图像帧表达,另外部分视频还包含背景音乐或者解说旁白。因此,视频处理即是对文字、图像、声音的多模态处理。着眼于多模态处理技术,提出基于语义空间统一表征的视频多模态内容分析框架,利用多种架构的深度神经网络,对视频的文字、图像、音频进行分别处理,为达到统一的功效,将不同结构的深度神经网络归结到语义空间,通过语义空间进行综合认知。提出的架构清晰、层次分明,对于视频理解的建模具有指导意义。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

电视技术

《电视技术》（CN：11-2123/TN）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

电视技术相关期刊

基于语义空间统一表征的视频多模态内容分析技术

服务推荐

在线咨询

杂志订阅

期刊推荐

西部广播电视

现代电视技术

中国有线电视

吉林广播电视大学学报