正交约束型SincNet可微分前端及在音频分类中的应用

Information Techology and Network Security(2022)

Cited 0|Views2
No score
Abstract
在音频场景分类任务中,现有端到端模型中特征建模层学习过程存在缺乏约束、学习结果缺乏直观解释以及仅适用于特定的后端分类模型等缺点.因此,以SincNet可微分前端为基础,引入正交约束提高其求解效率,同时提高所得可微分前端的可解释性,并使其能提高多种后端网络的分类性能.提出的这种新型可微分前端命名为正交约束型SincNet(OrthSincNet).研究发现,OrthSincNet卷积核对应的频谱既具有类似于梅尔滤波器的形态,又可提高分类效果.在UrbanSound8K官方评测数据集上的实验表明,相对于常用的梅尔频谱前端,OrthSincNet改进了6种后端分类网络的性能,分类准确率平均提高了2.2%.
More
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined