深度学习是人工智能的核心驱动之一,逐渐展现出爆发态势。1月13日,在AICon全球人工智能与机器学习技术大会上,百度AI技术生态部总经理喻友平分享了百度深度学习开源平台的演进、实践与思考,以及百度在深度学习人才培养上的实践和百度AI的开放战略。他表示,百度PaddlePaddle的目标是做最符合中国开发者需要的开源深度学习平台。
百度AI技术生态部总经理喻友平
深度学习框架是人工智能产业链的重要一环。喻友平介绍,深度学习已经成为国家战略的一部分,谷歌、微软、亚马逊等行业巨头均在加大力度扶持深度学习领域的研究,百度作为一家中国的人工智能公司,希望为开发者提供最适合中国国情的开源深度学习平台,最大程度地满足中国开发者的需要。
据悉,百度PaddlePaddle是一款分布式深度学习平台,于2016年正式开源,易学易用、高效灵活、开放彻底是它的突出特征。目前,PaddlePaddle已在社区活跃度、易学易用及工业应用三方面取得了突破性进展。
喻友平介绍,PaddlePaddle开源框架的训练部分支持浏览器、客户端等多种方式调用;目前PaddlePaddle已经集成了CNN、RNN等多种神经网络及深度学习算法,同时支持CPU、GPU、FPGA等多款硬件;作为一款并行分布式深度学习平台,PaddlePaddle支持多机多卡并行、数据并行、模型并行等,也支持私有化的部署。
开源以来,PaddlePaddle技术能力持续升级,推出新一代深度学习框架PaddlePaddle Fluid,并与Kubernetes合作了PaddlePaddle EDL弹性深度学习。PaddlePaddle Fluid提供高级语言中的while和if等控制流结构提升使用者的开发效率,同时将利用编译优化技术保证计算性能。PaddlePaddle EDL是全球首个支持弹性作业调度的开源AI云解决方案,通过与Kubernetes合作实现弹性作业调度充分利用机群计算资源。
在工业应用方面,PaddlePaddle目前已开放近20种工业级模型,包括点击率预估、语音识别、文本分类、图像分类、机器翻译、物体识别等,并广泛应用于百度内外部产品中。比如通过PaddlePaddle的开源模型对影响销量的变量进行组合计算,商家从而预测判断进货量,而这一应用,已经与中国民族便利店品牌Today达成落地。此外,利用PaddlePaddle平台为桃农制造的一台智能桃子分拣机可以实现智能分拣,分桃准确率已达90%以上,极大提高了人工效率。可以想象,在百度的不断推动下,深度学习技术将与更多行业产生化学反应,打造更多智能场景。
不断提升技术性能、加速工业应用的同时,百度已将PaddlePaddle开源框架彻底开放,包括从基础训练到预测、分布式的整套架构。“我相信百度是深度学习开源做得最彻底的,目的是让深度学习帮助更多企业和开发者。”喻友平表示。通过一年多的快速发展,PaddlePaddle已经成为日前全球开发热度(用Github pull request数量衡量)增速最高的开源深度学习平台。
对于PaddlePaddle开源社区的建设,喻友平表示,PaddlePaddle是一个由内至外真正的开源社区,社区里人人都是主人翁,百度欢迎所有开发者共同参与交流。据介绍,PaddlePaddle的代码贡献者有三分之二是百度以外的工程师,足见其开放度与包容性。
深度学习人才储备被看作一个公司是否能在人工智能的浪潮中留存一席之地的重要依据。喻友平介绍,为了培养更多深度学习领域人才,百度组建PaddlePaddle训练营助力开发者转型深度学习工程师,并在去年发起了国内第一个深度学习教育联盟,全方位支持深度学习人才培养。同时,百度还在本月发起了PaddlePaddle AI大赛,设立10万元作为奖金支持,目前约有170多个来自全世界的队伍参赛。
公开信息显示,百度已构建起包含算法层、感知层、认知层和平台层技术架构的AI技术平台,开放包含语音、图像、视频、增强现实、自然语音处理等在内的80多项核心AI能力,几乎涵盖目前已知人工智能的所有技术领域。喻友平表示,百度希望通过开放开源,为行业升级赋能,并在技术、生态、营销、客户资源方面支持更多的合作伙伴;同时,百度还开放了“燎原计划”,旨在帮助更多合作伙伴实现方案的落地。
大会当天,会议主办方极客邦科技创始人兼CEO霍泰稳宣布加入“百度燎原计划”,双方将会围绕行业的变革、趋势以及生态等方面深度合作,以助力人工智能的落地。