麻省理工的智能语音,可以让彩虹小马说“我爱北京天安门”了

文本智能生成语音的TTS系统现在已经挺成熟的了。先进的TTS系统早就脱离了单纯的“机械棒读”,通过人工智能辅助训练,在音调和语气上已经十分接近真人。

最近,MIT一位AI研究员的成果,把TTS往前又推进了一步。他编写的新AI,极大缩短了训练需要的样本数量。最少只要30分钟的语音素材,就可以用文本生成质量极高的语音。

也就是说,哪怕只是把游戏或者动画里某个角色的对话拆出来,跑一遍机器学习算法,AI就能模仿游戏中角色的语气生成新的语音。

目前这个AI提供了几种范例音色,在网上可以供人任意尝试。有《传送门》里的大Boss机器人GLADoS,有《小马宝莉》里的紫悦和柔柔,还有《史丹利寓言》里的旁白君。

其中,两个小马的配音质量是最让人震撼的,外网网友们普遍觉得这个AI已经十分接近动画里的语气和感觉了。当然这两个角色使用的训练素材也是最多的,除了全部的9季动画,据说还“通过各种手段”拿到了无背景音的配音原声。用这个AI生成的语音自制粉丝剧情,代入感肯定十足。

网友透露小马的音色素材质量和数量都是最好的

其次就是GLADoS,人工智能去学习人工智能呆板脱线的语气,传统艺能玩得有模有样。《史丹利寓言》的旁白和其他几个声线,可能因为是人类语气,素材又少了点,最终的效果还是稍微差一些。

这个AI最大的缺陷还阅读能力不太过关。根据作者的说明,AI对于多音字的处理比较愚蠢。比如“玩家” Gamer这个词,你打“Gamer”,AI就会念成“嘎们儿”。非得要打成“Gaymer”,它才能念对。

AI的阅读能力比较呆板,需要用技巧辅助发音

我调戏了一下这个AI,想要试试能不能教小马紫悦说两句中文。我们尝试了好几次,发现紫悦在说“我爱北京天安门”的时候,发音和语气不能两全。语气很象样的时候,发音不太对。发音调对了,语气又变得有点奇怪了。看来中文对小马驹来说还是太难了点。

网站上还有两个非常奇怪的范例角色:一个是《传说之下》里的骷髅人Sans,另一个是《传送门》里的主角Chell。如果你很好奇这俩人是怎么TTS的,那么恭喜你发现了重点。

???

下面是我教小马说中文的视频:

如果你也想试试这个TTS的话,可以点击这里,选择第二栏“App”可以调戏AI,第三项“Examples”可以听听作者精选的几条语音,效果确实非常棒。

热门相关:一念永恒   孙猴子是我师弟   一拳猎人   一拳猎人   孙猴子是我师弟