最新公告

综合资讯

更多>>

热门文章

语音技术应用的现状和未来

来源:admin 栏目:综合资讯 发布时间:2008-01-10 16:04:39 阅读:1730
 

语音技术应用的现状和未来

从目前语音技术的研究现状来讲,技术已经有了很大发展。语音识别和语音合成技术是实现人机语音通信及建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话和听懂人说话的能力。

 语音识别技术主要包含几个方面:语音控制、电子发声、连续语音识别、非连续语音识别和语音学习。目前主要是在支持中英文,实现中英文混合识别问题上,存在一些障碍。同时在识别大量词汇和个别发音方面还很难做到准确。作为语音识别技术新方向的语音学习,它则要求人模仿标准发音,其面临的困难是如何衡量人模仿的好坏。

 和语音识别相比,语音合成技术相对说来要成熟一些,是该领域中近期最有希望产生突破并形成产业化的一项技术。语音合成技术是计算机开口说话的关键,现阶段语音合成的最大进展是已经能够实时地将任意文本转换成连续可懂的自然语句输出,相应技术通常称为文语合成或文语转换(TTS)。TTS使得数据通信和语音通信在终端一级实现交融,人们将有望在获取Internet信息时,使短消息服务、电子邮件等多数以文本方式提供的信息也用语音的方式输出。语音合成的主要功能是:根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。

 语音合成技术的应用范围非常的广,如电话查询、话费催缴、呼叫中心、证券股票查询、教育系统资料查询等各类都有应用,在面对教育市场就主要是语音教学。

 目前的语音室功能都是基于语音教学功能上,传统的教与学还是占主导,教育部曾委托高等教育出版社、清华大学出版社、外语教学与研究出版社及上海外语教育出版社研制开发了四个版本的教学系统,并且远远不止这些研究机构,包括中科院也同样在研制一些有关语音方面的技术和产品,这为语音合成方面的发展和成熟做出了一定的推动作用。在课堂上学生通过语音平台听说练习,将学生的学习过程评价与终结考试相结合,对学生学习评测与对教师教学评估相协调,多层面、多角度、多环节地测试学生的英语实用能力。

 在基础教育领域,目前语音方面的产品并不是很多。但基础教育的市场是巨大的,而且是很有前景的。刘院长希望能够通过自己的努力和合作,开发出适合基础教育的语音产品。

语音库的建设的关键所在

 现在语音识别技术存在的一些瓶颈主要在于:方言或口音会降低语音识别率、背景噪音、口语的问题:它既涉及到自然语言理解,又与声学有关,口语的语法不规范和语序不正常的特点会给语义的分析和理解带来困难,有些很不自然的合成效果往往是因为没有能正确的使用合成与识别系统而导致的,并不是说是合成技术的不成熟,而是语音库的完善度存在一定的差距。

 在教育部所提出的学生考核中有这样的一个方面,考务人员要对学生口语成绩作出评估,但就目前来说是比较困难的,2003年我国高校在校生就已经达到了1900万,而从事大学英语教学的教师仅5万人左右,如此大量的在校生如果用传统的一对一教授方法是远远无法完成教学任务的,那么这些工作大部分都需要求助于计算机软硬件的实现,而实现这种可能就需要很完善的语音库。

 刘院长指出,我们国家目前的语音库建设相较国际水平还是有些差距,合成出来音质达不到高要求,对语音识别还没有特别突出的成果,主要还是资源的缺乏。在现有的语音库里大部分是女声,男声只占有很少的一部分,其他年龄阶段的数据就更加的少,这对我们进行情景对话,进行语音控制,进行模拟现实,进行时实语音评估等都存在一定的困难。诚然有许多的科研机构都在涉及语音识别技术这方面的研究,但对于语音库的建设就有一定的困难性,这是一项需要大投入时间、人才、资金的项目,国内目前只有少数几家走在前端的企业在做这一市场,正致力于解决困扰语音识别领域的某些技术缺陷,突破大量词汇、连续语音、非特定人的三大障碍。刘院长说,国际上大的IT企业都非常看好这块语音的尖端市场,我觉得语音识别技术是以后IT界未来十年中具有强劲潜力的发展方向。

语音技术的未来

 未来的语音技术将在智能化等方面有较大发展。在未来我们会生活在这样的世界里:当我们深夜回到家中,为床上熟睡的孩子盖好被角,并将宠物猫咪带出房间后,我们将大声向机器发出指令,说出我们想做的事情由语音设备完成执行,这并不是科幻,而是语音技术发展的结果。