您的当前位置:首页正文

基于卷积神经网络的语音情感识别方法

2023-03-12 来源:欧得旅游网
zzsgiolePfrpzPzzzPsgiolePfrp计算机科学 Science and Technology.nnovat ion Herald I团墨圆■一●瞄■崔■ -一-  粤PJ言芒 uu惜 prfPe图6lepochtimes 输出结果测试 (7)进行归一化操作。 (8)对音频进行裁剪,裁剪的音频帧数为40。 o同的图像边缘。在卷积神经网络中隐藏层的参数个数和隐藏 层的神经元个数无关,只和滤波器大小和滤波器的种类有关 系。 3使用卷积神经网络进行音频情感分类 i3.1卷积神经网络 人工神经网络提出于20世纪80年代,由单层感知机逐步 g卷积神经网络除了局部连接和权值共享的特性,纠正线 性单元(ReLU,Rectifled Linear Units)激活函数也保 证了实际训练中的单边抑值和稀疏特性,同时为了保证泛化 发展为多层感知机,它从信息处理角度对人脑的神经元进行 s特性,采用L2/Ll正则化范数作为激活偏置。 抽象。大量的节点之间相互连接,每个节点都有特定的激励 3.2具体实现 函数。在早期发展阶段,由于梯度爆炸问题和计算能力有限, (1)输入层:输入按帧数进行裁剪的音频40×40。 神经网络的发展一直停滞。2006年Hinton提出了深度置信网 (2)卷积层1:滤波器大小为3 X 3,共有20个滤波器,得到 络(Deep Belief Network,DBN)的深度产生模式 。使用 P20个大小为36 X 36的特征映射。 这种算法可以更好地初始化DNN的训练,从而开启了深度学 (3)池化层1:卷积层1后面跟着子采样层。子采样层的目 习发展的新篇章。. 的是减少特征映射的神经元个数。通过池化操作,可以大大 卷积神经网络(Convolutizon Neural Network)为深 降低特征的维数,避免过拟合。最大子采样函数的定义为: 度学习在目标识别和分类领域的较早应用。近年GPU计算能 力增加和海量业务数据的出现,使得大规模的CNN在机器 po ( )一f 吼 (1) 视觉和语音分类等领域得到了广泛应用。z 该层采用最大子采样方法,由特征映射中2 X 2的领域点 卷积神经网络本质是一种前馈神经网络,卷积神经网络 采样为1个点,也就是4个数中最大的。最终的特征映射数目 有3种结构上的特征:局部连接、权重共享以及空间或时间 为18 X18。 上的次采样。卷积神经网络的层与层之问采用局部连接,减 (4)卷积层2:滤波器大小为3 X 3,采用4 0组滤波, 少了计算量。 最终特征映射的数目为1 6 X 1 6。神经元的个数共有 卷积神经网络的层与层之间的连接权值是共享的,比如 40×16×16=10240。 图4中的in层与m一1层,每个m层神经元与3个m一1层的神经 (5)池化层2:采用2 X 2的池化操作,特征映射数目为 元进行连接,这个3个连接的权值是一样的。实际应用中,可 8 X 8。 以通过设置多种不同的滤波器来提取不同的滤波参数,从而 (6)卷积层3:采用的滤波器大小为3 X 3,采用6 0组 实现提取不同的目标特征。例如对于图像而言,就是提取不 滤波器,最终特征映射的数目为6×6,神经元的个数为 科技创新导报Science and Technology Innovation Herald 89 zIIj{Ill;Il;ll:锄60×6X6。 2i·;01 ; 6  -N-;0-—:.06  。。 。,。 . 。 。 。 。 。. 计算机科学 生气、惊吓、中性)对500句文本进行演绎而得到,16 kHz采 (7)池化层3:得到特征映射数目为3×3。 (8)卷积层4:采用滤波器大小为2 X 2,采用80组滤波。特 征映射数目为2X2。 样,16 bit量化。经过听辨筛选,最终保留其中9 600句。 输出结果测试:见图6。 在epoch次数为200时准确率达到8l%。 (9)全联接层:共有80X 2X 2=320个神经元。 (10)输出层:通过s0ftmax回归算法将特征映射到目 参考文献 1]詹永照.视觉语音情感识别[M].北京:科学出版社,2013. 标的6个分类。softmaX是logistic回归的多类形态。利用 [softmax函数定义目标Y=C的后验概率为: P(y:=:cIx):s。ftmax(wTx) 誉雨(2) 对于样本(X,Y),输出目标y={l,…,C}。我们用C维的 one-hot向量表示输出目标。对于类别C 具体表现见图5。 y:【,(1:c),z(2=c),…,t(c e)1 4测试与验证 验证采用CASIA汉语情感语料库。该数据库由中科院 自动化所录制,由4位录音人(两男两女)在纯净录音环境下 (信噪比约为35 dB)分别在5类不同情感下(高兴、悲哀、 (上接17页) 在金属基体中引入均匀弥散的纳米级增强体粒子,所得 的复合材料往往可以呈现出更加理想的力学性能和导热、导 参考文献 电、耐磨、耐蚀、耐高温及抗氧化性能。未来可以考虑将金属 …1司朝润,张贤杰,王俊彪.喷射成形颗粒增强金属基复合材 基纳米复合材料研究的重点放在纳米结构材料应用和纳米 涂层生产上。以碳纳米管应用为例,由于其具有优良的力学、 电学和热学性能,是制备金属基复合材料较为理想的增强 zPsg加强泡沫金属基复合材料研究与应用;泡沫金属基复合材 也可以赋予金属材料本身所不具备的某此物理、功能特性。 料,俗称多孔金属泡沫,其是最近几年发展成熟起来的一种 比如,用高热导率的金刚石、高定向热解石墨等作增强相, 结构功能材料,具有轻质、高比强度、减振、吸音、阻尼、散 与铜、铝等高导热金属复合,可以获得高导热率、低膨胀率 热、吸收冲击能、电磁屏蔽等多种物理性能与优点,是交通、 和低密度的理想金属基复合材料,可以在温度变化场合使用 建筑及航空航天等领域未来研究与应用的热点。 且能够保持尺寸的稳定性,在航空航天结构件生产等领域 3.2用碳纳米管增强金属基纳米复合材料性能 具有较高的应用价值。 体,随着碳纳米管制备水平提高及其成本价格走低,碳纳米 [3】全宏声.金属基复合材料在航天结构中的应用[J].材料工 管增强金属基复合材料定是未来研究的热点,也是世界各国 程,2001(12):15. zz9O 复合材料研究领域竞相争夺的技术制高点。因此,有必要通 [4]原梅妮,杨延清,李茂华,等.金属基复合材料多尺度计算 过加强碳纳米管增强金属基复合材料的研究,来缩短我国与 世界发达国家在金属基复合材料研究方面的差距。 3.3促进金属基复合材料结构功能一体化发展 伴随现代科学技术的发展,金属基复合材料的应用需求 越来越广,对金属基复合材料也不再仅仅局限于其某些优良 的机械性能,对其在多场合服役条件下具有的结构、功能一 体化和多功能响应特性等要求越来越高。为了强化金属基复 合材料的这种结构功能一体化和多功能响应特性,通过在 金属基体中引入的特定的颗粒、晶须或者纤维等异质材料, 科技创新导报Science and Technology Innovation Herald iolePfrpUnderstanding Workshop(ASRU).2013. Computation,2006(18):1527-1554. [2]T.S ainath,B.King Sbu rY,A.MOhamed,eta1. L e a rningf¨te r banks within a deep neural netwOrk framework【M].In P ro ceeding SOf The AutOmatiC SP ee ch RecognitiOn and (3) 【3】G.Hinton,S.Osindero,Y.Teh.A fast learning alg0rithm f0r de ePbelief net S【J].Neu ral [4]韩文静,李海峰,阮华斌,等.语音情感识别研究进展综述 [J】.软件学报,2014,25(1):37-50. 一方面可以作为增强体提高金属材料的机械性能,另一方面 料研究进展[J】.功能材料,2015(1):1001—1006. [2】朱宇宏,姚强,王燕,等.金属基复合材料检验方法研究现 状[J].中国标准化,2013(5):43—47. 方法研究进展[J].材料导报,2012(17):134-137. [5】陈素玲,孙学杰.金属基复合材料的分类及制造技术研究 进展 .电焊机,2011(7):90-94. 

因篇幅问题不能全部显示,请点此查看更多更全内容