·
搜索结果:找到“可懂度”相关结果138条
排序: 按相关 按相关 按时间降序
  • 【期刊】 低信噪比下高可懂度语音增强算法

    刊名:计算机系统应用 作者:刘鹏 关键词:子空间 ; 语音可懂度 ; 语音分段 ; 均方根 ; 增益矩阵 ; 客观评价 ; 主观试听 机构:山西工程技术学院信息工程与自动化系 ; 山西工程技术学院信息工程与自动化系 年份:2018
    摘要:提出了低信噪比下高可懂度的基于分段信噪比相对均方根(RMS)的语音增强子空间算法.现有的多数语音增强算法在低信噪比的恶劣条件下,改善带噪语音质量的同时通常会伴有语音可懂度的降低.一个重要原因是这些算法大都仅基于最小均方误差(MMSE)来抑制语音失真,却忽略了语音增强算法所导致的语音失真对差异类型语音分段的可懂度影响程度不同.为了改进这一缺点,提出了基于短时信噪比RMS对语音分段进行分类,然后调整处于信噪比中均方根语音分段的增益矩阵分量,来减小语音失真对增强语音可懂度的影响.客观评价实验说明,改进算法可以改善增强语音可懂度归一化协方差评价法(NCM)的评测值.主观试听实验说明,改进算法的确提升了增强后语音的可懂度.
  • 【会议】 汉语母语听者单耳英语通信可懂度受噪声的影响

    作者:王康 ; 王鹏 ; 邱小军 关键词:可懂度 ; 单耳 ; 双耳 ; 语音 ; 心理声学 ; 噪声 ; 对侧耳 机构:近代声学教育部重点实验室,南京大学声学研究所 ; 近代声学教育部重点实验室,南京大学声学研究所 年份:2016
    摘要:母语为汉语听者在英语地区进行单耳电话通信时,常使用英语进行交流,此时背景噪声影响通信语言可懂度。研究了咖啡厅噪声环境下,英语语音通信可懂度受信号耳3种信噪比以及对侧耳不同噪声级的影响。实验结果表明:信号耳信噪比越高,平均可懂度越大;信号耳信噪比高时,对侧耳噪声变化对可懂度产生的影响不显著;信噪比低时,适当对侧耳噪声级可提高可懂度,可懂度在对侧耳噪声级为80到82 d B时为较高值。为提高咖啡厅噪声环境下单耳通信可懂度,应提高信号耳处信噪比,将对侧耳噪声级控制在80到82 d B间。
  • 【期刊】 噪声谱估计算法对语音可懂度的影响

    刊名:声学技术 作者:张建伟 ; 陶亮 ; 周健 ; 王华彬 关键词:噪声谱估计 ; 谱减法 ; 时频块 ; 最小统计 ; 短时客观可懂度 ; 语音可懂度 机构:安徽大学计算智能与信号处理教育部重点实验室 ; 安徽大学计算智能与信号处理教育部重点实验室 年份:2015
    摘要:噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度
  • 【论文】 基于音素的语音可懂度评价方法的研究与实现

    作者:高源 关键词:语音识别 ; 发音检测 ; 语音可懂度 ; 机器学习 ; 计算机辅助语言学习 机构:北京工业大学 ; 北京工业大学 年份:2018
    摘要:伴随着全球文化交流的日益频繁,人们越来越明白熟练掌握一门外语的重要性。口语训练是语言学习的基本要求,而计算机辅助发音训练系统也随之成为语音识别应用中的一个重要研究方向。对于我国英语学习者口语发音评价的重要指标之一是语音可懂度,但目前在音素级自动语音可懂度评分与人类专家评分相关性差距较大。此外,由于非母语学习者发音错误的多样性,在对学习者发音检测过程中,相似音素发音易出现混淆,传统基于概率统计的检测方法很难覆盖到所有的错误音素类型,无法准确有效地反馈音素级的纠正建议来帮助学习者提升语音可懂度水平。针对上述问题,本文首先分析了目前常用发音检测技术的特点和局限,为了解决学习者由于汉语发音习惯产生的错误发音规律性问题。本文采用一种基于音素偏误发音网络的方法对学习者发音中的错误发音的音素进行检测,并研究出一种循环随机音素识别检测方法提高音素识别正确率和准确率,并使用SVM分类器对发音错误类型进行判别分类,结合语音可懂度评价方法,为学习者反馈纠错建议。实验表明,使用本文改进的音素识别检测方法,提高了音素语音特征识别的正确率和准确率。在对学习者语音可懂度评分时,针对目前常用语音可懂度评价方法与人类专家评分相关性差距较大的问题。本文首先分析了基于AI指数、语段特征以及音素得分评价方法原理及特点。研究一种新的基于音素组合特征的语音可懂度评分方法,即通过线性组合的方式得到新的声学特征测量得分来对语音可懂度评分,并实验验证了本文语音可懂度评分方法与人类专家评分的相关性。最后本文将发音问题检测方法与语音可懂度评价方法应用于实际在线原型系统中,设计了针对非母语学习者的语音可懂度评估系统。实验测试表明,通过该系统对英语发音进行检测和纠正错误音素后,学习者语音可懂度评分有了明显提高,进一步验证本文所提方法的有效性和实用性。因此本课题在计算机辅助发音领域有着一定的参考价值和应用价值。
  • 【论文】 言语可懂度与知觉相似性对于信息掩蔽的影响

    作者:许博淅 关键词:信息掩蔽 ; 认知信息掩蔽 ; 知觉信息掩蔽 ; 言语可懂度因素 ; 目标-掩蔽声音知觉相似性因素 机构:河北大学 ; 河北大学 年份:2015
    摘要:本研究所依据的是杨志刚等人(2007)提出的信息掩蔽三级加工模型,他认为信息掩蔽中至少包含两种亚成分即认知信息掩蔽和知觉信息掩蔽。而本研究是通过操纵掩蔽声音的可懂度因素以及目标-掩蔽声音间的知觉相似性因素进一步证实信息掩蔽中的两种亚成分的存在,并证明知觉信息掩蔽和认知信息掩蔽是可以分别对信息掩蔽发生影响的。本研究分为两个实验,均采用主观空间分离与多个说话人掩蔽的实验范式。实验一被试42名,采用2×3×4×3的4因素混合设计,通过操纵掩蔽声音中的可懂度因素来考察在知觉信息掩蔽不变的情况下,被试对目标语句的识别正确率的变化情况,实验二被试16名,采用2×10×4的3因素完全被试内设计,通过操纵目标-掩蔽声音的知觉相似性因素来考察在认知信息掩蔽不变的情况下,被试对目标语句的识别正确率的变化情况。实验结果表明:随着掩蔽声音的可懂度逐渐升高时(英语无意义语句<汉语无意义语句<汉语有意义语句),听者对于目标语句的识别率会降低,代表着当言语可懂度越高时所占用听者的认知加工资源就越多,对目标语句所造成的掩蔽量就越多;当目标-掩蔽声音流知觉因素越相似的时候,听者对于目标语句的识别率会降低,代表着声音相互间的知觉加工资源的竞争就越大,对目标语句所造成的掩蔽量就越多。有主观空间分离的条件下听者对于目标语句的识别率会更高。随着掩蔽声音中人数的逐渐增加,听者对于目标语句的识别率逐渐降低。本实验得出结论:信息掩蔽是一种多层次、具有复杂机制的现象。它至少包含两个层次的亚成分:知觉层次的信息掩蔽和认知层次的信息掩蔽。言语可懂度与目标-掩蔽声音的知觉相似性可以分别对信息掩蔽产生影响,当言语可懂度越高时所占用听者的认知加工资源就越多,对目标语句所造成的掩蔽量就越多,当知觉相似性越高时,声音相互间的知觉加工资源的竞争就越大,对目标语句所造成的掩蔽量就越多,并且认知信息掩蔽和知觉信息掩蔽是相对独立的。两种信息掩蔽的亚成分都对由优先效应所造成的主观空间分离敏感。在总体信噪比不变的前提下,随着掩蔽声中说话人数目的增加,知觉层次和认知层次的信息掩蔽都会增加。
  • 【期刊】 单通道语音增强对低信噪比汉语可懂度的影响

    刊名:电声技术 作者:陈亚繁[1] 许勇[2] 杨军[1,2] 关键词:语音增强 语音可懂度 声掩蔽 主观听辨实验 机构:中国科学院信息工程研究所 ; 中国科学院信息工程研究所 年份:2016
    摘要:可懂度是评价语言传递信息能力的重要指标。通过主观实验的方法,对白噪声、粉红噪声、Babble噪声以及时间反转信号四种干扰信号和三种单通道语音增强算法在低信噪比(-15~0dB)条件下对汉语可懂度的影响进行了测试和评价。结果表明,四种干扰信号的干扰效果差异明显;单通道语音增强算法不能显著提高汉语可懂度;测试语料选择对汉语可懂度的影响很大;时频域二值掩蔽算法对时间反转信号干扰下在维持和提高汉语可懂度方面存在优势。
  • 【论文】 混响对中国英语学习者英语言语可懂度的影响研究

    作者:李春艳 关键词:混响 ; 言语可懂度 ; 中国英语学习者 ; 元音和辅音 ; 区别性特征 机构:哈尔滨工业大学 ; 哈尔滨工业大学 年份:2018
    摘要:真实的语言交际往往在火车站、地铁站、机场、饭店、礼堂、广场、工厂、街边等复杂多变的环境中开展,因此言语交际会受到噪声、混响等环境声学因素的干扰,而不同的声学因素会对言语理解产生不可忽视的影响。对于以英语为外语的学习者而言,真实场景下的复杂声使得英语言语的理解变得更具挑战。本论文尝试探索混响声环境对中国EFL学习者英语言语可懂度影响的语音学机制。在本研究中,我们设计了两种言语可懂度的测试:实验一是英语句子听力测试;实验二是诊断性押韵测试。前者主要是为了探究混响对句子可懂度和不同音素识别度的影响,后者则主要探究混响对英语区别性特征的影响。测试条件有干音和混响两种声学条件。共计57名中国在校大学生完成了本测试。结果表明,首先,不论是从句子层面还是音素层面,混响条件下的中国英语学习者的英语言语可懂度要显著低于干音条件下的言语可懂度。不同英语水平的受试,其英语言语可懂度受混响的影响有所差异,英语水平越高,可懂度受混响的影响越小。其次,元音和辅音的可懂度受混响的影响也有所差异,表现为两种声学条件下元音可懂度受混响的影响要稍高于辅音可懂度所受的影响。测试结果也说明对于中国英语学习者而言,元音的感知要比辅音差。最后,混响对英语区别性特征的影响并没有特别显著的差异,但是其对不同的特征有着不同的影响。其中,鼻音特征和连续音受混响的影响要大(如在nest/best对中,鼻音[n]的辨别受混响影响正确率不高;在sheet/cheat对中,连续音[?]的正确率受混响影响有所下降),但咝音的结果与已有研究有所出入,这可能是因为中国英语学习者对某些咝音音素(如[s]/[θ]、[z]/[e])难以辨别。本研究进一步增加了混响这一声学条件对言语可懂度有不利影响的证据,也对中国大学英语教学和学习环境有一定的启发意义;同时也为建筑声学研究提供了更广的语言视角;另一方面也为中国大学生英语语音学习指出了重点和难点。
  • 【期刊】 提取耳蜗熵的语音可懂度评价算法

    刊名:中国科技论文 作者:付建梅 ; 张雪英 ; 曹棣 ; 马建芬 关键词:语音增强 ; 语音可懂度 ; 耳蜗熵值 ; 归一化协方差 机构:太原理工大学信息工程学院 ; 太原理工大学信息工程学院 ; 太原理工大学计算机科学与技术学院 年份:2013
    摘要:为了提高主观和客观听力条件下语音可懂度的相关度,提出用耳蜗熵值来衡量语音的可懂度。利用提取的耳蜗熵值分段后的语音作为归一化协方差(normalized covariance measure,NCM)的语音可懂度算法的输入,分析高熵值语音段和低熵值语音段主客观相关系数的高低。结果表明,提取的高耳蜗熵值语音段比低熵值语音段对语音可懂度算法与主观评价的相关性高,高熵值语音段携带有更多的语音信息。
  • 【论文】 提高骨导送受话器可懂度的方法与设计实现

    作者:刘玲 关键词:可懂度 ; 骨导送受话器 ; 自适应滤波 ; 时间机理 机构:西安电子科技大学 ; 西安电子科技大学 年份:2013
    摘要:送受话器是军用无线和有线通信系统中完成语音拾取与重放所必需的音频终端。送受话器的使用环境中通常存在各种噪声,而噪声会导致语音可懂度的降低,使人员之间的交流难以正常进行。如何改善送受话器在噪声环境中的通话质量,提高语音可懂度是人们在努力解决的一个重要问题。近年来,骨导送受话器在军用领域的应用呈现出不断扩大的趋势。本研究选择骨导送受话器为目标,在分析导致骨导送受话器语音可懂度降低的原因基础上,在送话方面根据自适应滤波理论,采用最小均方算法,对送话信号进行自适应滤波处理,通过提高送话信噪比来提高语音可懂度;在受话方面根据听觉的时间机理,采用幅度调制的方法将音频信号变换成高频调幅信号接收,通过提升语音的高频成分来提高可懂度。按照句子可懂度的测试方法分别对送话信号和受话信号处理前后的句子可懂度进行了对比测试,结果表明,在白噪声和粉红噪声条件下句子可懂度均有一定的提高。
  • 【期刊】 基于语音起始段检测语音可懂度客观评价方法

    刊名:电子技术应用 作者:徐宇卓 ; 马建芬 ; 张雪英 关键词:语音可懂度 ; 分段信噪比 ; 语音起始段检测 ; 相关系数 机构:太原理工大学计算机科学与技术学院 ; 太原理工大学计算机科学与技术学院 ; 太原理工大学信息工程学院 年份:2015
    摘要:传统的语音评价算法,如SNR,存在语音的可懂度相关性不高的问题。有研究表明,语音的不同部分对可懂度的贡献不同,语音的浊音起始段对可懂度的影响较大。提出一种可懂度相关性相对较高的语音评价算法。在计算分段SNR之前,对语音段进行选择,选出起始段。所提出方法的可懂度计算结果与主观得分进行比较,实验结果表明,结合语音起始段(speech onset)检测算法,能够将可懂度与主观评价的相关值分别提高0.11(辅音)和0.06(句子),这也从一个侧面验证了语音的起始段对可懂度有较大影响这一研究结论。
  • 【专利】 一种基于智能终端的高可懂度语音降噪算法

    作者:陈霏 ; 樊明福 年份:2017
    摘要:本发明公开了一种基于智能终端的高可懂度语音降噪算法,用于助听器和智能终端之间的通信,助听器从外界接收带噪语音信号并传输到智能终端,经智能终端处理,得到噪声估计,实现输出语音的高可懂度,具体包括以下步骤:(1)助听器从外界接收到语音信号传输到智能终端后,通过数模转换和WOLA分析滤波器分析后形成有两条路径并保存相位;(2)第一条路径是提取所保存的相位,第二条路径是数字化的语音信号传输至智能终端后进行VAD判断,得到连续无语音段序列NSpeech,并进行判别;(3)WOLA分析滤波器综合上述两条路径并重构之后输出得到高可懂度的语音信号,即完成了高可懂度语音降噪算法。本发明实现噪声的精确估计与消除,同时提高语音的可懂度
  • 【论文】 基于言语可懂度评价的高校教室音质改善策略研究

    作者:沙沫 关键词:高校教室声环境 ; 言语可懂度 ; 语音传输指数 ; 音质改善策略 机构:大连理工大学 ; 大连理工大学 年份:2017
    摘要:高校教室是师生学习交流的重要场所,良好的听音环境是学生正常学习的必要保障。由于种种原因,当前我国乃至世界范围内大部分教室的听音环境并不理想。对高校教室听音环境改善问题进行深入研究是有必要的,教室声环境问题也是建筑声学领域当前研究的热点。要对高校教室听音环境进行改善设计,首先需选择合适的客观参量对教室听音环境进行评价。一直以来教室听音环境的评价都是使用传统的声学参量(例如混响时间,背景噪声,声能比等)。随着言语可懂度的客观评价参量—语音传输指数(Speech Transmission Index,STI)的完善和发展,基于STI评价的教室音质改善设计成为可能。STI与一些传统音质客观评价参量如混响时间、背景噪声、明晰度C50等相比,因能综合考虑混响时间、信噪比的影响,并与言语可懂度的主观感受直接对应,有着传统评价参量不具备的优势。因此基于STI评价,对高校教室听音环境改善策略进行研究是非常有意义的。言语在教室中的传输是一个比较复杂的过程。教室的容积、平剖面体型以及吸声材料的布置都会对教室的言语可懂度产生不同程度的影响。为此,论文在对教室音质现状进行调查和分析的基础上,系统的研究了改善高校教室言语可懂度的设计策略和方法;结合音质仿真技术,将这些策略方法应用于不同类型教室的音质改善设计,并对其进行了言语可懂度的主、客观评价验证。论文的主要工作包括以下内容:(1)对高校教室的音质现状进行了主、客观评价,总结高校教室中存在的音质问题。(2)依据评价结果,对不同客观评价参量与主观评价结果的相关程度进行了对比研究,探讨了不同客观参量用于评价教室音质的准确性。(3)基于STI评价方法对教室言语可懂度的影响因素进行了研究。包括教室的容积、平面形状、剖面形状以及吸声材料的布置和选择四个方面。(4)根据对影响因素的研究,对改善教室言语可懂度的设计策略进行了总结,通过音质仿真技术,对设计策略应用于教室音质改善的有效性进行了主、客观验证,并对设计策略存在的不足和局限性进行了讨论。本研究工作对言语可懂度评价在教室音质改善方面的应用研究有较好的指导意义。
上一页 1 2 3 4 5 6 7 8 9 10 下一页 跳转