不同频段时域包络在普通话语句识别中的相对权重

Journal of Audiology and Speech Pathology（2021）

引用 0|浏览3

暂无评分

摘要

目的探讨不同带宽的时域包络(temporal envelope,TE)信息中不同频段在汉语普通话语句识别中的相对权重.方法以1.5和3个等效矩形带宽(equivalent rectangular bandwidth,ERB)对傅里叶变换处理的时域信息进行切割,通过Hilbert转换提取T E信息并分为5个相邻频段,测试听力正常者在不同条件下的言语识别率,并通过最小二乘法计算每个频段在言语识别中的相对权重.结果单频段T E信息下的言语识别率为3.90％～4.80％,双频段T E信息下的言语识别率为22.60％～85.40％,全频段T E信息下的言语识别率为100％.在1.5 ERB提取T E信息识别中,频段1～5的权重分别为0.28、0.08、0.21、0.25和0.18;在3ERB提取T E信息识别中,频段1～5的权重分别为0.29、0.05、0.32、0.21和0.14.结论随着T E信息提取宽度的增大,相同语句的言语识别率总体上呈现降低的趋势,可能是由于T E信息减少导致;在不同带宽提取的T E信息中,低频段(80～585 Hz)的TE信息在言语识别中的权重均较高,可能是因为此频段包含基频信息.

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要