真正能给用户带来价值的技术,才会有真正持久的影响力。7 月 5 日,百度 AI 开发者大会(Baidu Create 2017)在北京国家会议中心举行,其中以“开放创新 共襄 AI 未来”为主题的 AI 技术与开放平台分论坛,吸引了众多开发者关注。
百度副总裁、百度 AI 技术与平台体系(AIG)总负责人王海峰在开场致辞中表示,百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引擎的用户需求、数据和平台,支撑了百度 AI 技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。
“在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术,是真正实用的人工智能技术,”王海峰认为,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才能打造强大、更具活力的 AI 技术。
百度诞生于 PC 互联网时代,那是一个开放互联网生态的时代。在互联网的助力下得到迅速发展的 AI 技术,也应该秉承开放精神。更重要的是,AI 的影响将不限于互联网,AI 将影响各行各业和人们生活的方方面面。百度通过与开发者和社会共享 AI 技术成果,带动生态繁荣,推动社会进步。
此次,百度多年打造的完整AI技术平台将全面开放。百度的 AI 能力分为四层。
- 基础层:AI算法、大数据、大计算能力
- 感知层:包括语音、图像、视频、AR/VR 等技术
- 认知层:有自然语言处理、知识图谱及用户画像等技术
- 平台层:基础层、感知层、认知层的技术会平台化,通过百度 AI 开放平台 ai.baidu.com 开放,与开发者共享
截至目前,百度 AI 开放平台上开放的技术能力总共有 60 个,是最全面的 AI 技术开放平台。
60 项开放技术打造能力完整、组合丰富的开放平台
百度 AI 开放平台在完整性、开放性、前瞻性和发展性方面均领跑业界。此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术,与已经开放的 AI 技术一起,构成具有 60 项开放技术的完整的、综合的 AI 开放平台,为开发者提供形式多样、可定制、可组合的 AI 技术,满足开发者从 API、源码、数据到计算能力的多层次需求。
百度在AI技术上具有先发优势,完整布局和深厚技术积累。百度的 AI 技术始终随着百度的发展而不断进化,规模大、能力强的百度 AI 开放平台备受开发者青睐,这是对百度 AI 技术的认可。数据显示,百度 AI 开放平台语音 API 外部在线调用量半年增长 300%,图像 API 调用量半年以来保持月增长超 200%。
唤醒万物:语音技术+自然语言处理让机器更懂需求
语音交互成为人机交互的下一个风口,语音技术需求日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、 情感语音交互(Emotional CUI)等技术,开发者可以实现不同场景的智能应用,满足用户需求。
百度在开放语音技术,让机器听清用户的同时,更重要的是开放能让机器懂得用户需求的自然语言处理技术。此次分论坛由百度自然语言处理部总监赵世奇详细介绍了能力强大的语言理解与交互技术平台——UNIT。该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供多种定制化方案,还首创“训练师”模式,助力开发者训练对话机器人,赋予机器“理解”自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。今年"百度之星"开发者大赛的命题就是基于 UNIT 平台提供的语言理解与交互技术,“设计和开发一个以对话式人机交互为核心的智能产品”。
看懂世界:视频分析、人脸识别和增强现实技术
此次分论坛上,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。同事,本次开发者大会还发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了世界第一个室外语义分割 RGBD 视频数据集,以及完整的机器人视觉解决方案。
增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新 DuMix AR 开放平台,为开发者提供 AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的 AR 行业解决方案,赋能各行各业,共同探索 AR 价值。
在 AI 技术与开放平台分论坛上,除了发布新开放的核心技术能力,百度杰出科学家徐伟批露了 PaddlePaddle 的发展路径,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个深度学习开放平台,PaddlePaddle 将与开发者一起繁荣 AI 生态,引领行业发展。
本次大会主论坛上,百度集团总裁兼首席运营官陆奇强调,“Apollo 强大的生态、DuerOS 唤醒万物的能力,都是基于百度大脑,都是用百度大脑来获得越来越多的知识和能力,它们都是基于百度智能云上。”
此次备受瞩目的 AI 技术与开放平台分论坛,是 AIG 成立后的首次正式集体亮相,也是百度全面开放 AI
能力的实际体现。可以想象,未来随着百度 AI 基础能力的进一步开放,开发者、创业者、行业伙伴将如虎添翼,让人工智能技术赋能更多场景,创造更多价值;而另一方面,百度人工智能也会与开发者和行业伙伴一起,在实践中推动技术创新与进化,共襄 AI 未来,造福社会。