首页 > 科技 > 问答 > 科技知识 > 有哪些语音识别技术,语音识别技术原理

有哪些语音识别技术,语音识别技术原理

来源:整理 时间:2022-04-26 03:23:54 编辑:科技知识 手机版

3.语音识别技术的其他要点。一、语音识别原理语音识别,以目前主流的ASR-自动语音/语言识别技术为例,实现了将音频波形的模拟信号转换为字符的功能。先说语音识别的典型应用。最后,语音识别技术发展到什么程度了?

语音识别技术原理,语音识别是如何实现的?

语音识别技术原理,语音识别是如何实现的

感谢您的提问。文中缺失公式,由于这里编辑不方便,后面补充完整回答截图。一. 语音识别原理语音识别,以目前的主流ASR-自动语音/语言识别技术为例,实现的功能是把音频波形模拟信号转换为文字符号。其原理可以理解为一个计算机系统,输入语音,并分解为词字音节等元素,通过与软件内部存储好的特征元素模型进行模式匹配,找到最可能接近的文字词语或语句并输出。

ASR方法是建立在概率论与统计学科上。这与人类对话交流的过程有异同区别在于人类对话时,声音是通过耳朵进入大脑直接处理,不需要转变成文字,否则文盲就不能与他人沟通,事实并非如此相同点是都需要一个学习的过程,幼儿学说话是个反复强化记忆的过程,ASR的模型也需要语料的训练,得到一个合适参数的模型结构用来推理。

二. 语音识别技术的工程实现1.一种主流典型的ASR框架特征提取经典的MFCC梅尔频率倒谱系数法——对输入端的经过增强去噪等预处理后的音频波形文件进行特征提取,主要是滤波截断分帧加窗快速傅立叶变换FFT等信号处理操作,得到短时语音信号的功率谱,再经过三角窗滤波log对数离散预选DCT谱加权倒谱均值减CMS一二阶差分等操作,得到特征矢量,即可观测的词条序列假设最终期望识别得到的词条序列是。

需要成立一个语音词典或参考模型库,其中存放的是可能的词条序列人为设置,作为独立于语音特征矢量,即词条序列在相应语言库中出现的概率声学模型对声学单元建模,每个声学元素由连续的多个状态和状态之间转移组成,用概率密度函数状态转移概率。可近似理解为一套数据结构和数学操作,实现的是进来一个声音单元可以是音素字词句,输出一组二进制序列/向量。

这里以经典的隐马尔可夫-高斯HMM-GMM统计模型为例现在许多用DNN替代GMM。声学模型输出条件概率序列标记为语言模型声学模型智能识别某段音素序列,不能识别词语。语言模型描述词语之间语法规则,通过概率密度分布函数来识别词条。语言模型有基于文法规则和统计类型的,后者是目前的主流,例如N元文法N-gram模型,就是根据前面n个音素预测第n 1音素。

实际中需要用到平滑和剪枝算法,不详述。语言模型的输出是先验概率解码器对矢量序列按照统计准则贝叶斯等计算条件概率,通常用Viterbi算法实现,动态规划的最优化选择,原理是搜索最大概率状态序列进行求解,具体不详述。2.上述框架的完整识别过程声学模型输出条件概率序列标记为,输出语言模型输出先验概率,语音词典可能的词条序列,有了这三个数组,我们就可以得到语音识别结果。

用数学公式表达如下由最大后验准则MAP和贝叶斯公式根据假设独立性和搜索过程不变,上式简化为对于连续语音识别的过程,可以理解为经过MFCC得到的特征序列进入声学模型声学模型中,每个字词都有对应的HMM等参数,通过声学特征对字词进行搜素得到特征序列的待定字词候选字词进入语言模型,通过词法规则和语言模型得到待定词句再由句法等语言模型搜索得到完整的识别语句。

3.语音识别技术的其他关键点:语料准备。人工智能是由人工数据提供的智能。模型的训练需要事先准备大量的语音语料库和文本语料库,类型包括一般领域和特定领域。语料库加工需要清洗和标注,包括标准重音标注、词汇标注、句法标注、语义标注等。训练声学模型需要大量的语音语料来训练语言模型需要大量的文本语料来训练ASR。ASR的难点包括非孤立词词汇量大,语音长而不间断。

文章TAG:有哪些语音识别技术语音识别技术原理

最近更新

  • 手机里的图片都在哪里?,你们手机里的照片都存在哪里

    手机空间释放后,上传到腾讯相册不显示占用空间,手机操作过程中也不会出现卡顿现象。清理手机垃圾时,腾讯相册不会有垃圾,所以整体上没有发现内存占用现象。我给大家分享一个储存照片的好方法 ......

    科技知识 日期:2022-07-20

  • 人为什么要有价值观,一个人存在的价值是什么

    树立正确的人生观和积极的价值观,首先要树立正确的是非观。决定一个人价值观的标准不一样。根本区别在于各自的创造力、精力,差异化的社会分工,利益分配平衡中相对统一的需求。一个人的认识和 ......

    科技知识 日期:2022-07-19

  • 为什么黄牛抢票用什么软件,为什么还会有黄牛抢票

    黄牛使用的抢票软件是独立软件。最后黄牛用的抢票软件和我们的差别很大。我们平时用的软件都是市面上常用的。这些抢票软件都是很多人用的,服务器平均分配后自然减少了我们每个人的份额,这也是 ......

    科技知识 日期:2022-07-18

  • 为什么苹果亮银贵,为什么苹果的数据线这么贵

    你知道为什么苹果的数据线贵但是容易断吗?苹果手机最大的优势就是iOS系统和苹果的A系列处理器。关键是最便宜的苹果数据线官方售价149元。按照大部分苹果数据线不到一年的使用寿命,光是 ......

    科技知识 日期:2022-07-18

  • 谷歌眼镜显示屏在哪里,哪些VR眼镜值得买

    VR眼镜的分类目前VR眼镜主要分为VR盒子VR一体机和PCVR。去的太早了,先发明骑行用的智能眼镜还好,但还没消失。第二代企业版谷歌眼镜高通SnapdraonXR1平台运行,不出售 ......

    科技知识 日期:2022-07-18

  • 上海哪里体验一加手机,一加手机真的快不行了吗

    说到一加,总会有一大批人说一加手机只活在互联网上。比如现实中没有一加手机的踪迹。一加定位,首先你必须是网络爱好者,否则一般没机会看到。其次,一加一直以来都是精品旗舰策略,每一次新机 ......

    科技知识 日期:2022-07-17

  • 为什么冬季雾霾最严重怎么办,夏天难道就没有雾霾吗

    为什么冬天有雾霾,夏天没有?看来雾霾的主要原因还是气象条件。其实冬天的雾霾已经比以前轻很多了。所以直到现在,冬天还是有雾霾。个人认为和农民烧麦秸没关系。入秋以来,随着来自中国的西北 ......

    科技知识 日期:2022-07-17

  • 苹果为什么好用,苹果的系统那么难用

    我用的是苹果安卓,我觉得苹果不好用。我承认苹果系统很流畅,但是旗舰安卓机型还可以,更重要的是也很耐用。苹果系统真的没有安卓系统自由。换了苹果第二天就开始想念安卓了,应用很忙。微信视 ......

    科技知识 日期:2022-07-17