天天看點

《語義網基礎教程(原書第3版)》—— 1.3 一種分層方法

本節書摘來自華章出版社《語義網基礎教程(原書第3版)》一 書中的第1章,第1.3節,作者:(希)grigoris antoniou(荷)paul groth(荷)frank van harmelen(荷)rinke hoekstra ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

語義網的發展按步驟進行,每步都在一個層次之上建立另一個層次。這個方法的實用性論證是它更容易在小的步驟上達成一緻,也就是說,如果有太多的目标,則很難讓參與的每個人都同意。通常許多研究組研究不同的方向,思想的競争是科學進步的主要驅動力。但是,從工程的角度則需要标準化。是以,如果絕大多數研究人員同意某些事情而反對另一些,穩固這些共識則是有意義的。這樣,即使一些更有野心的研究成果會失敗,但是至少有部分正面的結果。

一旦一個标準被确立,許多組織和公司将采用它而不是等待着觀察最終是否有可替代的研究路線會成功。語義網的本質在于公司和單個使用者必須建構工具、添加内容并使用這些内容。我們無法等到完整的語義網願景變成熟—這可能還要10年時間來完全實作它(當然,是以今天的想象)。

在一個語義網層次上建構另一個層次的過程中,必須遵循兩個原則。

向下相容性。完全了解某一層次的agent應該能夠解釋和使用更低層次的資訊。例如,了解owl語義的agent能夠充分利用rdf和rdf模式中的資訊。

向上部分了解。設計應該使得完全了解某一層次的agent應該能夠至少部分利用更高層次的資訊。例如,一個僅了解rdf和rdf模式語義的agent可能能夠通過忽略超出rdf和rdf模式的元素,部分地解釋owl中的知識。當然,并不是要求所有工具都提供這種功能性,關鍵在于允許這種選擇。

雖然這些想法理論上很吸引人并且被作為指導原則來指導語義網的發展,實踐上卻存在困難,并且不得不采取某些妥協。這在第4章讨論rdf和owl分層時會進一步說明。

圖1-4展示了語義網的“分層蛋糕”,它描述了語義網設計和願景的主要層次。在最底層我們可以發現xml,一種允許使用者使用使用者定義的詞彙表來撰寫結構化網際網路文檔的語言。xml特别适合于在網際網路上發送文檔。此外,用于xml中的uri可以按照它們的命名空間(namespace)聚類,在圖中表示為ns。

《語義網基礎教程(原書第3版)》—— 1.3 一種分層方法

rdf是一個基本資料模型,正如實體–聯系模型一樣,它表達了網際網路對象(資源)的聲明。rdf資料模型不依賴于xml,但是rdf有一個基于xml的文法。是以,在圖1-4中,rdf位于xml層之上。

rdf模式提供了将網際網路對象組織為層次結構的模組化原語。重要的原語包括類和屬性,子類和子屬性聯系,以及定義域和值域限制。rdf模式是基于rdf的。

rdf模式可以被認為是一種表達本體的基本語言。但是還需要一些更加強大的本體語言(ontology language),它們擴充rdf模式并且允許表達網際網路對象間更加複雜的聯系。邏輯層用于進一步增強本體語言并允許描述面向特定應用的聲明式知識。

證明層(proof layer)包括了實際的演繹過程,以及使用(更低層次的)網際網路語言來表達證明和驗證證明。

最後,信任層(trust layer)将伴随使用數字簽名(digital signature)和知識的其他類别出現,基于可信agent的推薦或者基于評分和證書中介及消費體。有時,“信任網”用于表示信任将被組織成與網際網路本身一樣的分布式的、混亂的方式。位于金字塔的最頂層,信任是一個高層且重要的概念:當使用者對其操作(安全性)和提供的資訊的品質信任時,網際網路才能實作其所有潛力。

經典的分層蛋糕是語義網日程表上的主要驅動力,但是現在已經相當過時了。特别是本體詞彙表層的許多替代者已經出現。另外規則語言已被定義在rdf之上,繞開了本體詞彙表層,這特别适用于最近從豐富的語義結構向大規模(語義)資料處理的轉變。是以這裡給出的分層蛋糕主要是示例的目的,作為展現語義網曆史觀點的一種方式。