23号下午,北京开了一场关于智能语音技术的大会,发布了目前最前沿的智能语音技术。
这场大会就是百度语音开放平台三周年主题活动会,百度首席科学家吴恩达,代表研究团队发布了四大语音技术——情感合成、远场方案、唤醒二期、长语音方案,为开发者提供免费接入入口。作为智能语音技术最重要的应用之一,百度手机输入法会上正式发布新版本,利用深度整合语音识别等人工智能技术,新增多项功能。未来的输入法或许不再是简单的输入工具,而是全面成为“人机交互”的核心介质。
百度首席科学家吴恩达在演讲中介绍新版百度输入法
百度首席科学家吴恩达在主题演讲中表示,语音是人类交流、人机交互最自然的方式,使用百度的语音识别系统,用户在手机端输入就可以更快、更方便、更自然。新版百度输入法以语音技术变革为核心,重磅推出语言转文字功能、语音调取联系人信息功能,结合人工智能自动匹配表情,让聊天更生动有趣。
通过深度应用最新语音技术,新版百度输入法打造出一款不仅能够听懂用户所言,更能读懂用户需求的智能应用,让输入不再单调。在大会现场百度语音输入法展台,参会嘉宾及媒体亲身体验百度语音输入法的新功能和效果。
据了解,新版百度输入法“联姻”语音技术,基于Deep Speech系统,以高达97%的语音识别率,在方言背景或者快语速等场景下,百度大脑语音识别比人类识别更准确。在杂音比较多的环境下,比如车载环境下,可以达到92%—93%左右。新版百度输入法结合语意分析,可精准判断出用户输入意图。值得一提的是,百度智能输入法还可根据语义语境,通过分析用户语音,分析当前情绪状况,自动为用户匹配符合情绪的趣味表情,很好地弥补了因语音输入文字时对语意表达的缺失。
此外,百度输入法还可实现“语音指令”和语意识别查找联系人。例如在语音输入状态,输入“给张玮打电话”或“你知道张玮电话吗”,都将弹出电话拨打卡片,前者是通过语音指令直接查找,后者是通过语意的识别查找联系人。新版本中还在聊天场景下新增搜索功能,边搜边聊,一键获取关键词信息。
百度语音输入法依托百度在人工智能在语音识别、自然语言理解能力等方面的领先技术提升人机交互体验,正在推动语音输入走向普及。作为百度人工智能应用成果之一,百度输入法将继续在“人机交互”的技术之旅探索,实现与用户的自然语言交流,创新更懂用户需求的智能输入法,为用户打造有温度、有情感的移动应用。
(来源:重庆晚报)