总部坐落于北京的百度公司占据了中国搜索引擎80%的市场份额,现如今该公司正在大力发展人工智能(AI)技术。2013年,百度建立了深度学习研究中心,旨在专注于机器学习的研发。而在2017年5月份,该研究中心推出了最新版本的DeepVoice,内核是文字到演讲的AI引擎。
DeepVoice二代紧随在今年早些时候公开亮相的DeepVoice一代之后,可以进行几乎与人类声音相媲美的实时演讲。更令人吃惊的是,只需要通过一个30分钟的音频模板就可以模仿数百种不同地区的口音。
相比于早期的DeepVocie所需要的数小时学习时间来比,第二代性能更加强劲。DeepVoice二代可以通过区分数百种口音来建立自己的人声语音库。然后,软件可以自主地从语音库中调取语音数据。与苹果公司所开发的Siri所不一样的是,siri需要工程师手工输入数千小时的演讲,而DeepVoice二代是完全自主进行的。
“把数据导入软件,它就可以自己了解语言的哪些特征才是最重要的。”坐落于硅谷的百度AI实验室的研究科学家安德鲁•吉本斯基(AndrewGibiansky)向媒体说道。