您现在的位置是:首页 >

为什么计算机能听

火烧 2016-12-11 12:22:36 1046
当你坐在计算机前,机械地敲击键盘,逐个地输入字符,你可能会有一种与“哑巴”在对话的感觉。 如今,一种全新的声音控制计算机的方式进入了人们的生活。例如,当一个总经理上班,到了办公室门口,他对着门喊一声“开门”,办公室门自动打开。进了门说一声“请各部门经理立即

当你坐在计算机前,机械地敲击键盘,逐个地输入字符,你可能会有一种与“哑巴”在对话的感觉。

如今,一种全新的声音控制计算机的方式进入了人们的生活。例如,当一个总经理上班,到了办公室门口,他对着门喊一声“开门”,办公室门自动打开。进了门说一声“请各部门经理立即到会议室开会”,五分钟之内,各部门的经理都来到了会议室。这是怎么一回事呢?原来,安装在总经理办公室的一台计算机能听懂总经理的话,是它指挥门和电话语音系统作出了反应。

为了能更加方便、自由地和计算机“对话”,计算机工作者早就着手研究如何使人能够通过语言与计算机进行直接的对话。

人与机器进行对话,首先就是要让机器能够听懂人的语言,并且按照人的指令处理一系列的事务,最后将执行的结果以语言的形式通知有关的人。

使计算机能够听懂人类的语言,必须要有一套复杂的软、硬件设备来支持,它必需包括语音分析器、存储器以及有关的控制电路等基本部件。

话筒获得语音信息后,把语音送入语音分析器,语音分析器提取必要的语音信息参数,并与存储器中的标准语音进行匹配,如能匹配成功,则计算机理解(识别)了该语音信息,并作出相应的响应。

一般的语音识别系统都有学习的功能,使用者可以训练它。比如,电话局可为移动电话用户提供一种语音拨号系统。用户可先训练一下自己的电话机,把经常要拨的电话号码及对方姓名对着电话机念上三遍。以后再用时,只要按一个键开启系统,然后报出对方姓名和号码,即可自动接通。这种移动电话语音识别系统的设计原理是:计算机系统中的语音库将用户首次读入的姓名和电话号码制成标准语音样本,以后每次使用时,都将用声音输入的姓名和号码与库中的语音样本进行比较,如一致,则接通相应的电话。

语音识别的对象分为三个层次。首先是对单音节的识别,然后是对单词的识别,进而是对符合某种规则的语句的理解。在现实世界中,任何两个人的发音不可能完全相同,甚至同一个人说一个字也不总是以同一种语言、语调来说。另外,同一个单词又可能有不同的含义。这就使计算机难以令人满意地理解自然语言。目前大多数语言理解系统十分简单,往往带有很大的限制,离真正的理解还有很大的差距,有待进一步研究。

关键词:语音分析 语音识别 语音库

永远跟党走
  • 如果你觉得本站很棒,可以通过扫码支付打赏哦!

    • 微信收款码
    • 支付宝收款码