像百度地图这种导航软件里的明星语音包,都是靠明星去录制大量的音频吗?需要说多少字?

2020-06-27 科技 105阅读

不需要明星录制大量音频。

语音包都是靠软件合成的,明星只需要录制一些包含特征词的句子,例如“直行”、“左转、右转”、“前方有红绿灯”、“前方有测速拍照”等等。

而比较长的句子则要用到TTS(Text To Speech)技术了,也就是文本转语音技术,包括Siri、谷歌翻译用的就是这一技术。通过计算机语音合成,可以将任意文本转换成具有高自然度的语音。

原理上,只要让明星把汉语中的21个声母、37个韵母、5个声调组合的不超过3000个语音全部录一次,播放时,再把每个字的语音串起来就可以了。

这就好比活字印刷术,明星每个字的发音都是一个单字,TTS会把这些单字重新排列组合成导航里的长句子。

虽然组字成句听起来略显生硬,但随着TTS语音技术的发展,自然度已经越来越高了。

扩展资料

TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。

它是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。TTS技术对文本文件进行实时转换,转换时间之短可以秒计算。在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。

TTS语音合成技术即将覆盖国标一、二级汉字,具有英文接口,自动识别中、英文,支持中英文混读。所有声音采用真人普通话为标准发音,实现了120-150个汉字/分钟的快速语音合成,朗读速度达3-4个汉字/秒,使用户可以听到清晰悦耳的音质和连贯流畅的语调。现在有少部分MP3随身听具有了TTS功能。

TTS是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页,转换成自然语音输出。TTS不仅能帮助有视觉障碍的人阅读计算机上的信息,更能增加文本文档的可读性。现在的TTS应用包括语音驱动的邮件以及声音敏感系统,并常与声音识别程序一起使用。

参考资料:百度百科-TTS

声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com