更接近人类:苹果利用深度学习纠正Siri发音
- +1 你赞过了
一直以来,苹果都致力于让Siri的声音尽量接近人类,而非机器人化。Siri还将出现在iOS 11系统中,并与全球用户见面。近日,苹果发布了一篇论文,阐述了公司如何利用深度学习让Siri的声音听起来更像人类。不仅如此,公司甚至在论文中附带有语音样本,方便读者辨别不同声音之间的差别。
首先,苹果需要寻找到合适的配音演员,并进行长达10到20个小时的语音录入。随后,开发者们将会把这些语音割分成很多个板块,并把这些组成块组合成全新的语言,并注重构建语句的韵律以及语音。
更接近人类:苹果利用深度学习纠正Siri发音
此外,苹果团队还将研究如何将Siri集成到移动设备上,由于Siri将会给移动设备的处理器带来很大的压力,影响设备性能。因而苹果还需要对此做出一番调整。
而在这一过程中,苹果都依赖于机器学习达成了这一目的。充足的训练数据将帮助系统理解不同的音节进行配对,并使整个对话听起来更为自然。
而在iOS 11系统中的Siri发音听起来更为自然。苹果已经找来了一个全新的女性录音演员,要求其用美式英语进行了长达20个小时的录音,产生了100—200万个音频分段,而这些分段则会被用来进行训练深度学习系统。
(Via:ubergizmo.com)
最新资讯
热门视频
新品评测