Quora是问答型SNS网站,被誉为“获取高质量内容的来源地”,也被国内行业称为美版“知乎”,聚集了大量高质量知识用户。在接受邀请后,王海峰在前后近三个小时时间里,认真回答网友问题,其中单个问题最多获得近700名网友评论。
王海峰作为百度搜索引擎的总负责人,同时还负责着手机百度、百度信息流、百度新闻、百度手机浏览器、自然语言处理等业务。是自然语言处理领域世界上最具影响力的国际学术组织ACL(Associationfor Computational Linguistics)50多年历史上唯一的华人主席,在人工智能领域有着重要影响力。此次参与网友问答,将进一步传递其人工智能理想,王海峰在答案中写到,人类在不久的未来将会进入人工智能时代,而百度的优秀工程师们将在其中发挥重要作用。
以下为问答实录。
1、中国的人工智能研究到了什么程度?
人工智能在中国实现飞速发展。今年,中国政府工作报告中首次提到人工智能的概念,这表明中国十分重视人工智能的发展。包括百度在内的大多数互联网企业都在加大人工智能方面的投资。其中许多企业都设立了专门的部门,推动人工智能在各自业务中的开发与应用。制造业企业运用人工智能降低成本,以人工智能为核心业务的创业企业也像雨后春笋般涌现。
此外,中国有许多大学和研究机构也在开展人工智能方面的学术研究。近些年来,越来越多优秀科学家与学者们投入到人工智能领域,其中不乏行业公认的佼佼者。在今年的洛杉矶AAAI大会上,有三分之一的论文来自中国,比例与美国相当。
人工智能不仅迅速应用于各大行业,而且也在改变日常生活,包括交通系统、教育、医疗等各个方面。我相信,人类即将进入人工智能的时代。
2、百度的机器学习研究团队会不会聘请不会讲中文的人才?
百度已经聘请了不会讲中文的人才,而且不光是机器学习团队,其他团队也有。
3、用于中文与用于英文的神经语言程序主要有哪些不同?
从语言学上来讲,中文与英文截然不同。中文文本信息没有单词间隔,而且中文主要通过词序来表明语法关系。这些因素加大了中文语言在词汇、句法和语义层面消除歧义的难度。因为现代语言学的概念与原则更适用于英文,而不太适用于中文。
目前,大多数主流神经语言程序方法都同语言无关。这些统计数据或神经网络算法会根据不同应用,对具体语言进行优化。
比如,百度在2015年5月推出了首个大型在线神经机器翻译系统。与语言无关的基础NMT模型也可以实现相当好的翻译结果。为进一步优化翻译性能,我们还根据具体语言的特征对翻译系统进行了优化。
4、百度有没有与IBM Watson或者Facebook的Wit.ai类似的可访问AI API解决方案?
请访问 ai.baidu.com,就可以使用语音、图片、NLP、用户画像等百度人工智能技术。
5、未来十年里搜索引擎会有怎样的发展?
现在,一说到搜索引擎,大多数人会想到搜索框和搜索结果。那么未来的搜索引擎会是什么样子呢?现在还不好说。但是我们都愿意看到更加强大的搜索引擎,能够让我们看到、听到甚至感受到不同的场景、产品和界面。搜索将会无处不在。
首先,是将更加理解用户的意图和内容,意图与内容的匹配也更加精准,这些都将大大增强搜索引擎的使用体验。理解用户意图不仅仅涉及某一次查询,而是适应更加复杂的搜索环境,包括查询条目、时间、位置、设备和用户的个性特征。而理解内容也将大大深入,不仅能更好的理解语音、语境、观点,还能理解内容的其他各个方面,从内容中剥离出知识点。意图与内容的匹配也将考虑上述所有因素,提供更加贴合个人情况与具体语境的搜索结果。此外,搜索引擎也会更像“应答引擎”和“执行引擎”,能够直接回答或执行大部分用户查询。
其次,搜索界面也将有更多创新变化。除键盘外,还能更加广泛的使用语音和图片等输入方法。用户将可以使用更加高效、便捷的多模搜索,使用语音、图片等更多实用技术。特别是,自然语言交互也将成为搜索引擎的主流交互模式。用户可以与搜索引擎对话,直接把想法告诉搜索引擎,这比打开键盘输入要方便实用得多。用户可以与搜索引擎进行多轮的交替性对话。运用这种全新的交互方法改善用户体验,百度可谓是先人一等。
第三,搜索不仅仅是使用搜索引擎,还嵌入到了各种产品之中。比如说,搜索将成为人工智能硬件的关键功能。未来,搜索将无处不在,随处可见。而且,我们还将重新定义可搜索的内容,不仅包括当前搜索引擎已经索引的内容,还将纳入更多服务、物体、设备和数据。
搜索引擎已是大家日常生活中必不可少的内容。人们需要确定搜索引擎的发展方向,而技术进步则能确定搜索引擎的发展高度。
6、百度产品如何应用NLP?
百度研发了多种NLP技术,包括知识图表、语意理解、内容标签、倾向分析、生成、总结、回答问题、机器翻译和对话系统等。这些技术广泛应用于搜索、推送、智能助手等产品中,为数百万用户提供服务。我们还将这些技术集成到统一的平台之中,名为NLP云。NLP云可以提供二十多个NLP模块和方案,为百度产品提供各种服务。我们的NLP云服务每天都要收到上亿次的查询。
比如在搜索方面,单词划分、命名实体识别、语法分析和释意等NLP模块都是经典NLP模块。这些模快均已实现优化与技术突破。NLP搜索的典型应用案例还包括回答问题。高性能的问答系统需要对查询实行精准的语义语法分析,广泛的知识谱系结构,还有全面的网页搜索结果分析,用户在搜索框中输入问题,搜索引擎就可以直接提供答案。我们许多人会使用搜索引擎查找相关信息,来帮助我们做出决策。在这种情况下,倾向性分析也叫观点挖掘,可以帮助我们找出备选观点,为用户提供整合后的信息。
举个例子比如新闻推送,文章质量十分重要。NLP可以甄别谣言、剽窃等垃圾文章。另外,文本分析可以找出高质量文章,并产生能够说明文章质量的标签。从各个层面说明用户偏好的用户模型也要用到NLP技术。
总而言之,对自然语言来说,NLP技术必不可少。
7、你认为从科学家到IT公司业务副总裁的职业转变是什么?
我迷恋技术,并且喜欢把自己投入到研究中去。我一直相信技术可以改变世界。百度为我提供了一个理想的平台,在这里,我的技术工作得以快速、直接地惠及用户。这就是我加入百度的首要原因。我在百度的前几年领导了包括NLP、语音、图像、数据挖掘、知识图、机器学习和深度学习在内的技术团队。后来,我意识到伟大的产品将连接技术和广大用户,并将推动技术进步。伟大的产品不仅需要先进的技术,而且需要出色的设计、营销和高效管理。因此,我逐渐将我的角色从研发团队的领导转变为管理层经理。我现在的领导团队由3000多名技术、产品和营销人才组成,他们年轻、充满活力、富有激情。我们正共同努力,通过我们的技术和产品,追求我们改变人们日常生活的理想。
当我接手一个大企业集团时,我需要首先设定战略和目标,然后建立正确的执行团队。良好的法规和文化对于一个大团队来说非常重要,这是业务进展良好的支持和保证。与此同时,我始终关注技术突破,用户需求的演变以及整个社会的发展。
8、“百度”这个词的意思是什么?
我们的名字,其灵感来源于800年前中国宋代的一首诗。“......众里寻他千百度,蓦然回首,那人却在灯火阑珊处。”百度的字面意思是“数百次”,代表对理想的不懈追求探索。
9、在未来5到10年,我们将在NLP中看到什么进步?
在机器翻译、语义理解、问答和对话技术方面将会有重大突破。而且这些技术将被广泛应用,导致人与计算机之间的沟通、人与各种硬件之间的沟通以及人与人之间的沟通都会发生改变。
上述技术进步将受益于以下四个方面:大数据、学习机制、知识图谱、推理和规划。
大数据——随着互联网的蓬勃发展,数据的数量和种类在高速增长。即便是那些传统的商业部门也开始把他们的数据放到线上,一切都在线上被连接起来。数据的价值在物联网上会继续增长。
学习机制——学习机制也将继续进步,这使我们能从大数据中学习更多。
知识图谱——有了大数据和更强大的学习机制,我们可以构建更大的知识图,建模整个世界。
推理和规划——因为有了大的知识图,我们可以在推理和规划方面取得突破,推理和规划的能力将为NLP系统注入更多智慧。
10、在百度作工程师是什么样子的?
百度工程师的典型工作时间是这样的:坐在沙发上用耳机写代码几个小时;在会议室或休息室与其他工程师讨论技术问题或系统设计。你会看到他们一边在餐厅吃午饭或晚餐,一边在互相谈论算法优化;你会看到他们工作到深夜。
这里的工程师有他们自己的腔调:实用、自我驱动和贯彻到底。我们鼓励工程师将想法付诸实施。只有拥有激情、毅力和责任的人,才能使梦想成真。百度搜索引擎每天为数亿人提供服务,使它更好地了解大多数用户需要。百度工程师有机会专注于最有价值的问题,并提出创新解决方案。百度作为一个平台,支持具有才华和热情的工程师实现他们的目标并取得成功。
年轻的工程师也有时间加入不同种类的爱好俱乐部,业余时间可以在健身房和瑜伽室进行攀岩、跳舞或锻炼。
在百度,我们为每个新招聘的工程师提供导师计划。导师将教导他们技术技能,并指导他们熟悉规则。我们还有高级技术指导提供在线学习计划和演讲,工程师可以选择关注他们感兴趣的话题,了解关于尖端技术的见解。我们甚至有黑客马拉松活动,鼓励工程师大胆思考,与设计师同行,创造出惊艳的产品。
我相信百度是工程师钻研技术、投身工作的最好平台之一。