天天看點

明略科技HAO圖譜Open API:開放企業級知識圖譜建構能力

由深度學習掀起的這波 AI 浪潮極度依賴資料,經過 10 年的發展,深度學習在一些場景應用上已經面臨瓶頸。業内有一種聲音得到了大量認同:人工智能的進一步發展與突破,需要從感覺智能向認知智能的突破,知識圖譜能有效從資料中挖掘出知識,以更具可解釋性的 AI 指導人類在更多複雜場景中的智能決策和行動。

7 月 11 日,在 2020 WAIC 世界人工智能大會上,明略科技 HAO 圖譜,作為目前世界上第一個語音實時生成圖譜的企業級知識圖譜開發工具包,首次公開亮相,成功入圍了大會最高獎項 SAIL 獎(Super AI Leader)TOP30 的項目及 2020 年度 SAIL 榜單。

明略科技首席科學家、明略科學院院長吳信東在開發者日:開發 · 開源 · 社群主題論壇上正式宣布 HAO 圖譜依托國家新一代人工智能開放創新平台開放 Text2KG API 接口,賦能開發者和企業級使用者。

負責 HAO 圖譜具體研發工作的是明略科學院知識工程實驗室,我們與實驗室主任張傑博士進行了交流,他向我們介紹了明略科技的 HAO 圖譜技術及應用落地。

HAO 圖譜,源自于 2018 年明略科技提出的 HAO 智能理論架構。HAO 智能旨在內建人類智能(HI)、人工智能(AI)群組織智能(OI),打通感覺、認知和行動系統,幫助企業群組織實作智能化發展。其中,HAO 圖譜屬于認知系統的範疇。

HAO 圖譜,可以獨立運作,也可傳遞給企業技術團隊進行二次開發,核心子產品包括語音流監聽,語音轉文本,标點預測,口語順滑,文本補全,實體關系抽取,實體對齊,以及圖譜話題切換。

明略科技HAO圖譜Open API:開放企業級知識圖譜建構能力
具體來說,HAO 圖譜的輸入為一維的文字序列或語音流,系統工作時分為如下幾步:

  1. 逐句翻譯,形成大圖:首先将輸入序列逐句的做實體識别和關系抽取,繪制成圖結構,每新增一句,就在原有的圖結構上增加新節點和新邊;
  2. 篇章摘要,找到重點:當整段文本或語音輸入結束後,再在篇章級大圖譜上,根據節點的語義、圖結構、位置等特征識别出重點節點和邊;
  3. 關聯背景知識:将重點節點和關系映射到背景的領域知識圖譜上,利用領域知識圖譜擴充其語義資訊。領域圖譜包括:由大量執行個體組成的資料圖譜、由因果關系組成的因果圖譜、由領域本體結構和領域詞表組成的語義工具;
  4. 圖譜增強的應用:針對領域内的特定場景需求,基于圖譜做可視化互動、分類、檢索、推薦、文本生成等特定任務。

目前 HAO 圖譜開放的 Text2KG API 接口,提供了文本轉圖譜的能力,但背景還做了一些面對 PDF、PPT、word 等半結構化文檔的資訊抽取接口。 

知識圖譜技術在産業界正經曆着應用的高速增長,學術領域前沿成果與實際落地應用場景間依然存在着巨大的鴻溝,設計、開發、部署一套知識圖譜系統,會面臨資料标注、模型訓練調優、高并發高可用等一系列問題。「目前業内仍缺少一個工業級的穩定工具,HAO 圖譜是第一個語音實時生成圖譜的企業級知識圖譜開發工具包。」張傑表示。

在實際的知識圖譜建構流程中,标注資料、訓練模型需要花費大量時間。而 HAO 圖譜很大程度上解決了上述問題,讓資料分析師或者是模組化人員集中精力在業務層,而底層的收集資料、标注資料、訓練模型、資料抽取以及與背景關聯可以通過調用 HAO 圖譜 Text2KG API 完成,避免了大量的重複工作。「根據實際的企業使用者使用情況來看,可以幫助開發者節約 60% 左右的時間。」張傑介紹。

HAO 圖譜所提供的模型,既包含通用模型,也包含特定領域的模型,如汽車、奶粉、美妝等。通過 API 接口,使用已經訓練好的開放域模型和特定領域模型,開發者可以集中精力在使用知識圖譜解決實際的業務問題上。

知識圖譜的應用涉及可視化、分類、檢索、推薦和生成。目前,HAO 圖譜已經被廣泛應用在社交輿情分析、銷售技能教育訓練、金融交易反欺詐、案情研判、裝置維護、城市及園區管理等不同場景。

在推薦領域,将領域知識有效融入算法,提高推斷準确率一直是研究的難點之一。知識圖譜,可将人類專家經驗和規則,以及大量來自網際網路、各個産業生産中獲得的資料,有機結合,通過對不同實體(節點)之間關系的進行分析,獲得洞察。「知識圖譜蘊含一定的可解釋性,因果關系相對比較明确,這一特點讓它在金融、軌交、電力、公共安全等行業中得以較快落地。」

在社交媒體輿情分析場景中,基于知識圖譜,可以把使用者産生的評論,與背景已有的品牌資料結合,對産品特性進行觀察,分析特定次元的使用者輿情走勢,随後把這些結果整合到 BI 系統,為營運人員提供使用者需求洞察。在此基礎之上,實作千人千面的個性化廣告。

在智能導購場景中,比如,銷售人員通過佩戴明略的智能工牌,在保障使用者隐私和資料安全的前提下,将銷售對話轉為文字,進行話題分類,形成一個話題轉移的知識圖譜,計算出話題之間轉移的機率,幫助銷售人員複盤,分析流單的主要環節,改善話題轉移和引導,提高成單率。

總之,HAO 圖譜可以把企業資料按照業務邏輯抽象為陳述性知識或過程性知識,生成資料洞察以更易使用的方式為業務服務。「通過曆史資料的分析和行業專家先驗知識的輸入,知識圖譜可以很大程度上把行業知識複現出來,并實作能力的複用,明略科技能夠在曆史資料達到 10PB 級、日均增量資料超過 10TB 的環境下進行資料價值的挖掘,實作毫秒級的預測性分析,結合行業知識圖譜形成決策和行動。」

目前,在企業智能化服務領域,明略科技已成長為一家明星公司。去年 8 月,明略科技成為第二批「國家新一代人工智能開放創新平台」建設機關,以開放、創新、共享為基本原則,持續建設軟體與硬體平台、開源社群平台、教育訓練平台,建構人工智能衆創平台和标準驗證明驗室,設立人工智能産業基金,全面打造平台生态體系。HAO 圖譜 Text2KG API 已在明略科技國家新一代人工智能開放創新平台官網上線。

本文為機器之心報道,轉載請聯系本公衆号獲得授權。

✄------------------------------------------------

繼續閱讀