在昨天下午舉行的論壇中,百度副總裁、百度 AI 技術與平台體系(AIG)總負責人王海峰在開場緻辭中表示,百度在人工智能領域深耕多年,從十七年前百度誕生之日起就開始積累,幾乎所有主要人工智能技術都已在百度搜尋引擎中得到應用,來自搜尋引擎的使用者需求、資料和平台,支撐了百度 AI 技術的快速發展,現在百度人工智能在算法、資料、技術等方面具有領先優勢。
「在每天數十億次使用者請求的千錘百煉下,百度的人工智能技術已是真正實用的人工智能技術。」王海峰認為,人工智能的技術還在不斷進步,但另一方面,隻有将技術與實際應用相結合,根據使用者需求和回報反複疊代優化,才能打造強大、更具活力的 AI 技術。
作為一家大型科技公司,百度誕生于 PC 網際網路時代,那是一個開放生态的時代。百度認為,在網際網路的助力下得到迅速發展的 AI 技術,也應該秉承開放精神。更重要的是,AI 的影響将不限于網際網路,AI 将影響各行各業和人們生活的方方面面。百度希望通過與開發者和社會共享 AI 技術成果,帶動生态繁榮,推動社會進步。
在大會上,百度宣布其多年打造的完整 AI 技術平台将全面開放。百度的 AI 能力分為四層。在基礎層,是 AI 算法、大資料、大計算能力。在感覺層,包括語音、圖像、視訊、AR/VR 等技術。認知層有自然語言處理、知識圖譜及使用者畫像等。在平台層,基礎層、感覺層、認知層的技術會平台化,通過百度 AI 開放平台 ai.baidu.com 開放,與開發者共享。截至目前,百度 AI 開放平台上開放的技術共有 60 個,已成為最全面的 AI 技術開放平台。
開放技術打造完整平台
百度正試圖通過開放的生态體系在人工智能的時代引領發展的潮流。此次宣布開放的語音、自然語言處理、視訊、增強現實、機器人視覺等技術,與已經開放的 AI 技術一起,構成具有 60 項開放技術的完整的、綜合的 AI 開放平台,為開發者提供形式多樣、可定制、可組合的 AI 技術,滿足開發者從 API、源碼、資料到計算能力的多層次需求。
在自動駕駛的精細資料集中,每一幀的圖檔要幾個小時才能完全标注,百度第一次開放了 3000 幀用于自動駕駛的全标注資料集,并計劃在今年 9 月開放更多。
作為中國科技巨頭中第一個選擇轉型的企業,百度在 AI 技術上具有先發優勢,完整布局和深厚技術積累。百度的 AI 技術始終随着公司業務的發展而不斷進化,由于龐大的使用者規模和強大的人才積累,百度 AI 技術的開放對于開發者們來說是一個好消息。在大會上,百度表示,其 AI 開放平台多項技術的使用量過去半年都有 2 倍以上的增長。
喚醒萬物:語音技術+自然語言處理
語音互動或許是人機互動的下一個風口,随着亞馬遜 Alexa 等智能裝置的興起,語音技術的需求正日益增加。百度語音技術部總監高亮在分論壇現場介紹了本次新開放的遠場識别及語音喚醒、定制化語音合成、語音合成音色、情感語音互動(Emotional CUI)等技術。通過這些開源的技術,開發者們可以實作不同場景的智能應用,輕松設計出滿足自己需求的産品。
在利用語音技術,讓機器了解使用者所指之後,更重要的是能讓機器懂得使用者真正的需求,這就需要用到自然語言處理技術。在分論壇中,百度自然語言處理部總監趙世奇詳細介紹了語言了解與互動技術平台——UNIT。該平台将開放語言了解技術、互動技術,從百度大資料中自動汲取最有價值的資料提供給開發者使用,為開發者提供了多種定制化方案,還首創「訓練師」模式,助力開發者訓練對話機器人,賦予機器「了解」自然語言,聽懂使用者需求,以及與使用者進行多輪次對話的能力。
看懂世界:視訊分析、人臉識别和 AR
在論壇中,百度研究院院長林元慶介紹了視訊分析與了解、機器人視覺和人臉識别等技術。同時,本次開發者大會還釋出了全面的視訊語義了解技術,包括視訊封面選摘、視訊分類、視訊比對、細粒度識别、視訊稽核、視訊公衆人物識别、視訊結構化分析等。此外,林元慶還介紹了用于自動駕駛機器學習訓練的語義分割 RGBD 視訊資料集,以及完整的機器人視覺解決方案。
增強現實(AR)技術作為全新的視覺互動形式,越來越受到營銷、娛樂、遊戲等行業關注。百度增強現實實驗室主任吳中勤現場釋出全新 DuMix AR 開放平台,為開發者供 AR SDK、内容制作工具、雲端内容平台和内容分發服務。吳中勤表示,未來百度将提供更多場景的 AR 行業解決方案,賦能各行各業,共同探索 AR 價值。
在 AI 技術與開放平台分論壇上,除了釋出新開放的核心技術能力,百度也表示将對已有技術進行改革。百度傑出科學家徐偉批露了 PaddlePaddle 的最新發展路徑圖,宣布百度會開源代碼、開放大規模資料集、開放計算能力、開放應用模型庫。作為國内首個開源深度學習平台,百度在 PaddlePaddle 的研發中持完全開放的态度,試圖與開發者們共同推進技術的發展。「在重新設計之後,今年 9 月我們将推出全新版本的 PaddlePaddle,」徐偉表示。「在簡化代碼,運作更加高效的基礎上,它将對移動端和嵌入式裝置有更加完善的支援。」
而在計劃于 2017 年 12 月推出的新版本中,PaddlePaddle 将支援英偉達全新 Volta 架構的 16 位浮點運算,并加入 TensorRT 的支援。
Create 2017 開發者大會上備受矚目的 AI 技術與開放平台分論壇,是整合了 NLP、KG、IDL、語音、大資料等核心技術部門的百度 AI 技術平台體系 AIG 成立後的首次集體亮相,全面展示了百度的 AI 技術能力。可以想象,未來随着百度 AI 技術的進一步開放,開發者、創業者、業内公司将不斷從中受益,讓人工智能技術賦能更多場景,創造更多價值;而另一方面,百度也會從這些行動中不斷提升自己的競争力。無論如何,這次開源行動必将推動國内人工智能領域的加速發展。
相關連結
- 開放/開源計劃: http://ai.baidu.com/
- Apollo GitHub: https://github.com/apolloauto