不同频段时域包络在普通话语句识别中的相对权重

Journal of Audiology and Speech Pathology(2021)

引用 0|浏览3
暂无评分
摘要
目的 探讨不同带宽的时域包络(temporal envelope,TE)信息中不同频段在汉语普通话语句识别中的相对权重.方法 以1.5和3个等效矩形带宽(equivalent rectangular bandwidth,ERB)对傅里叶变换处理的时域信息进行切割,通过Hilbert转换提取T E信息并分为5个相邻频段,测试听力正常者在不同条件下的言语识别率,并通过最小二乘法计算每个频段在言语识别中的相对权重.结果 单频段T E信息下的言语识别率为3.90%~4.80%,双频段T E信息下的言语识别率为22.60% ~85.40%,全频段T E信息下的言语识别率为100%.在1.5 ERB提取T E信息识别中,频段1~5的权重分别为0.28、0.08、0.21、0.25和0.18;在3ERB提取T E信息识别中,频段1~5的权重分别为0.29、0.05、0.32、0.21和0.14.结论 随着T E信息提取宽度的增大,相同语句的言语识别率总体上呈现降低的趋势,可能是由于T E信息减少导致;在不同带宽提取的T E信息中,低频段(80~585 Hz)的TE信息在言语识别中的权重均较高,可能是因为此频段包含基频信息.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要