HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种增量式学习的语音字典构造方法

作者:滕少华; 宋欢; 霍颖翔; 张巍语音压缩语音解压实时处理流式数据增量学习稀疏字典学习

摘要:爆炸式增长的语音数据为存储与传输带来极大困难,现有方法难以实时应对海量语音频域数据.因此本文提出一种增量式学习的语音字典构造方法,该方法先将语音时域信号经短时傅里叶变换处理后转换为各窗频谱幅值,再将高维空间向量投影到低维空间,并以字典中的少数基向量线性拟合当前窗向量.进而通过存储基向量的标识和拟合系数完成对当前窗向量的存储,把无法拟合的窗向量经处理后加入字典,实现增量式学习.解压过程依据用户请求将字典中指定条目经线性拟合实现.实验结果表明,本方法能大幅度压缩语音频谱包络,适用于受带宽限制下实时高采样率的流式语音数据,与同类算法相比,在保证还原质量的情况下,能对信号的存储空间以及传输带宽进行大幅度的压缩.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

广东工业大学学报

《广东工业大学学报》(双月刊)创刊于1974年,由广东省教育厅主管,广东工业大学主办,CN刊号为:44-1428/T,自创刊以来,颇受业界和广大读者的关注和好评。 《广东工业大学学报》主要刊登机械、材料、电气、电子、自动化信息、计算机、化工、环境资源、建筑、基础学科及有关交叉学科等方面的学术论文,研究报告,并选登具有新风解的学术争鸣文章。

杂志详情