轻量化卷积神经网络在音频场景分类中的应用研究
在线阅读 下载全文 下载Pdf阅读器
刊名 《机械工程》
作者 浦容瑄 (上海华瑄商贸集团有限公司 201802) 英文名 Mechanical engineering 年,卷(期) 2024年,第8期
主办单位 环宇科学出版社 刊号 ISSN:2661-3530(P)/2661-3549(O) DOI 10.12361/2661-3549-06-08-163206

轻量化卷积神经网络在音频场景分类中的应用研究

为了提高低复杂度神经网络在音频场景识别中的特征提取能力和性能,本文探索了基于卷积神经网络(CNN)的音频场景分类方 法。在传统 CNN 结构的基础上,增加并优化了单独的注意力映射层,比较了两种适用于轻量卷积网络的注意力机制,并在部分卷积层采 用了深度可分离卷积以减少参数量。原始卷积被低成本的分组条状卷积取代,设计了时频分离的卷积结构,最终提出了 SFAC(Sequence Frequency Attention CNN)网络模型。在语音场景多分类数据集上的实验结果表明,与多个基于 VGG 结构的基线模型相比,SFAC 在保持 低复杂度的同时实现了更高的准确度。

00852-67508818

营业时间:9;00-11:30 13:30-17:00

地址:总部:香港湾仔骆克道315-321号幸运广场23楼C室;分部:香港九龍新蒲崗太子道東704號新時代工貿商業中心31樓5-11室A03單位

邮箱:gjkzxtg@126.com

客服QQ:3577400288

Copyright 2015-2035 华文科学出版社 版权所有 All Rights Reserved     京ICP备2023009018号-3