语音识别技术原理是什么 讯飞语音识别技术特点介绍 讯飞语音识别收费标准
时间:2023-08-23 00:16:09

语音识别技术原理简介

自动语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。

语音识别技术所面临的问题是非常艰巨和困难的。尽管早在二十世纪五十年代,世界各国就开始了对这项技术孜孜不倦的研究,特别是最近二十年,国内外非常多的研究机构和企业都加入到语音识别技术的研究领域,投入了极大的努力,也取得了丰硕的成果,但是直到今天,距离该技术得到完美解决还存在着巨大的差距,不过这并不妨碍不断进步的语音识别系统在许多相对受限的场合下获得成功的应用。


(资料图)

如今,语音识别技术已经发展成为涉及声学、语言学、数字信号处理、统计模式识别等多学科技术的一项综合性技术。基于语音识别技术研发的现代语音识别系统在很多场景下获得了成功的应用,不同任务条件下所采用的技术又会有所不同。下图是在一个相对通用的任务条件下的语音识别系统示意图。语音识别系统构建过程整体上包括两大部分:训练和识别。训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”;而识别过程通常是在线完成的,对用户实时的语音进行自动识别。识别过程通常又可以分为“前端”和“后端”两大模块:“前端”模块主要的作用是进行端点检测(去除多余的静音和非说话声)、降噪、特征提取等;“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别(又称“解码”),得到其包含的文字信息,此外,后端模块还存在一个“自适应”的反馈模块,可以对用户的语音进行自学习,从而对“声学模型”和“语音模型”进行必要的“校正”,进一步提高识别的准确率。

语音识别技术发展历史及现状

语音识别的研究工作大约开始于20世纪50年代,当时AT&T Bell实验室基于共振峰提取技术实现了第一个可识别十个英文数字的语音识别系统——Audry系统。

60年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态时间规划(DP)和线性预测分析技术(LPC),其中后者较好地解决了语音信号产生模型的问题,对语音识别的发展产生了深远影响。

70年代,语音识别领域取得了较大进展。在理论上,LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。

80年代,MFCC的参数提取技术和HMM模型的深入使用使得语音识别技术得到进一步的发展,语音识别的问题逐步在理论体系上得到了比较完整和准确的描述,同时在实践上又逐步研发出效率较高的解决算法。

90年代以来,在美国国防部的Darpa测试、Ears计划、近期的Gales计划,以及我国863计划等推动下,一大批高水平的研究机构和企业加入到语音识别的研究领域,极大地推动了语音识别技术的发展和应用。语音识别系统已经从过去的小词汇量、孤立词识别、特定人识别、安静环境等简单任务逐步发展到大词汇量、连续语音、非特定人、噪声环境下的识别任务,从单纯的语音识别任务发展到语音翻译任务,从实验室系统走向商用系统。

讯飞语音识别技术

讯飞语音识别技术的理念是提供信息时代人机沟通的最佳方式。在核心技术研究方面,科大讯飞公司一直秉承着“顶天立地”的方针。“顶天”,就是要求在基础技术上不断创新,不断突破;“立地”,就是技术要和实际应用相结合,最终能够产生经济效益和社会效益。讯飞语音识别技术的研究继承了这样的优良传统,在基础技术方面锐意进取,不断创新,特别是在特征鲁棒性、模型区分性训练、大词汇量语音识别解码技术、语音模糊搜索等方面提出了多项创新性观点,并多次在国内外著名的学术期刊、会议及专刊上进行发表,取得了丰硕的成果。在技术与实际应用相结合方面,也充分考虑了应用系统之间的差异,为客户量身定制,提供了语音命令识别、智能语音搜索、语音检索等技术,并正在开展针对自然连续语流的会议内容转写识别整套解决方案。

标签:

最新
  • 语音识别技术原理是什么 讯飞语音识别技术特点介绍 讯飞语音识别收费标准

    语音识别技术原理简介自动语音识别技术(AutoSpeechRecognize,简称ASR)

  • 欧洲车企迅速追赶,全球新能源车销量排名洗牌

    TOP5品牌的市占率达到47%。

  • 《原神》4.0枫丹新食谱购买位置

    在原神版本中出了许多新食谱,这些新食谱都非常有枫丹特色,有恢复生命

  • 得益于开源驱动的更新,AMD显卡在Linux游戏的光追性能获得了大提升

    为AMD显卡打造的,开源的MesaRadeonVulkan驱动RADV将会在接下来的版本

  • 夜经济特色活动不断 夜晚的首钢园成为打卡地

    “好有夏夜的氛围!”上周日晚,马先生和朋友来到首钢园聚会,待到晚上

  • 永安行在丽江成立智能科技公司

    天眼查App显示,近日,永安行(丽江)智能科技有限公司成立,法定代表

  • 2死15伤!江苏盐城遭遇龙卷风,风速最大时能把大树连根拔起!村民:有老人被吹入河中

    8月13日16时15分左右,受强对流天气影响,江苏省盐城市大丰区部分镇出

  • 大闸蟹买回来怎么保存 大闸蟹买回来怎么保存不坏

    1、冰箱储存:把大闸蟹捆起来,然后放在冰箱的冷藏柜,盖上湿毛巾即可

  • 香港6月零售业销货价值同比升19.6% 连升7个月

    香港6月零售业销货价值同比升19 6%连升7个月---中新社香港8月1日电香港

  • 好莱坞不香了,最强暑期档被国产片吊打|暑期档观察

    图片来源:视觉中国如果说前些年国产电影票房大获成功,是受到诸如国产

  • 新能源汽车7月成绩单出炉:比亚迪月销26.22万辆 蔚来、小鹏重获元气

    【新能源汽车7月成绩单出炉:比亚迪月销26 22万辆蔚来、小鹏重获元气】

  • 飞沃科技董秘回复:目前公司产品主要应用于风电领域

    飞沃科技(301232)08月01日在投资者关系平台上答复了投资者关心的问题。

  • 汉文帝刘恒母亲南陵附近发现大熊猫 2000年陪葬

    在陕西西安白鹿原,考古队员在汉文帝霸陵西侧的动物殉葬坑中,发现了20

  • 2023年湖南注册会计师考试地点

    《2023年湖南注册会计师考试地点》由注册会计师考试时间网发布,主要内

  • 安兔兔7月安卓手机性能磅出炉:红魔8S Pro夺冠

    快科技8月1日消息,安兔兔今日公布了7月安卓手机性能榜,红魔8SPro以16

  • 梅赛德斯奔驰s600多少钱_奔驰s600多少钱

    1、奔驰s600指导价:259 8万成交价能便宜10万左右。本文到此讲解完毕了

  • 旅游
    • 汤姆猫:公司海外团队也在测试Google的Bard模型

    • 这个夏天,1400名新徐工人共赴一场青春盛会!

    • 国家疾控局:汛期来临,保持这些健康卫生习惯

    • 择期宣判!郭刚堂儿子被拐案一审庭审结束,人贩子拒不认罪