作者:何丽; 袁斌音乐分类长短时记忆网络梅尔倒谱系数频谱质心频谱对比度
摘要:针对传统的基于人工标注的文本音乐分类存在人工标注成本高,易于出错,没有涉及到音乐本身的内容的问题,提出了一种基于音乐内容的分类方法,将深度学习中的长短时记忆网络(LSTM)应用到音乐流派分类中。从包含10种音乐流派的1000首歌曲中提取出梅尔倒谱系数,频谱质心和频谱对比度三个特征,将提取出来的特征数据输入到LSTM网络中进行训练,输出每种音乐类别的概率。对此,进行了三次实验。第一次是将梅尔倒谱系数,频谱质心作为特征数据输入到LSTM网络中,第二次是以频谱对比度和频谱质心作为特征数据,第三次是将梅尔倒谱系数,频谱质心和频谱对比度作为特征数据。从实验结果上看,当梅尔倒谱系数,频谱质心和频谱对比度作为特征数据时,模型的分类效果最好,分类准确率最高。实验结果表明,该方法在准确率上比玻尔兹曼机和卷积神经网络等方法都有所提升。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社