基于视听分层模型的实时爆炸场景识别

作者：庄越挺; 傅正钢; 叶朝阳; 吴飞听觉视觉压缩域粗分支持向量机爆炸场景识别

摘要：提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的"爆炸"场景在压缩域进行识别的算法.首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开,由此得到音频爆炸备选场景.由于大多数爆炸场景均伴随剧烈的视觉突变,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化,得到最后的识别结果.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机辅助设计与图形学学报

《计算机辅助设计与图形学学报》（CN：11-2925/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情

服务推荐

计算机辅助设计与图形学学报相关期刊

基于视听分层模型的实时爆炸场景识别

服务推荐

在线咨询

杂志订阅

期刊推荐

佳木斯教育学院学报

网友世界

计算机光盘软件与应用

计算机与网络