天天看點

Azure 存儲簡介

Azure Storage Account(存儲賬戶)包含所有Azure Storage的資料對象,包括Blob、Data Lake Gen2,File、Queue、Disk和Table等服務,該Storage Account為使用者的Azure Storage資料提供了唯一的命名空間,可以通過HTTP或HTTPS來通路它。Azure Storage Account中的資料是持久的、高度可用的、安全的和可擴充的。

一,存儲賬戶的類型

Azure Storage提供了4種類型的存儲賬戶,每種類型都支援不同的功能,并具有自己的定價模型。

  • General-purpose v2 accounts:基礎的存儲賬戶,用于Blob、Data Lake Gen2,File、Queue和Table等服務,最常用和最基礎的存儲賬戶。
  • BlockBlobStorage accounts:具有進階性能特征的bock blob和 append blob。推薦用于高事務處理率、資料較小且低存儲延遲的場景種。
  • FileStorage accounts:純檔案的存儲賬戶
  • BlobStorage accounts:舊版的Blob-Only的存儲賬戶,推薦使用General-purpose v2 accounts。

存儲賬戶的作用是為使用者在Azure中提供唯一的命名空間,存儲在Azure Storage中的任何對象都有唯一的位址,且都在唯一賬戶名下。賬戶名和Azure Storage Blog endpoint的組合構成了存儲賬戶中對象的基位址。

舉個例子,如果存儲賬戶的名稱是:mystorageaccount,預設的Blog storage的endpoint是:

http://mystorageaccount.blob.core.windows.net

1,存儲賬戶的端點

存儲賬戶為Azure中的資料提供了唯一的命名空間,使得存儲在Azure Storage中的每個對象都有一個唯一的位址,該位址包含在存儲賬戶名,也就是說,存儲賬戶和Azure 存儲服務的端點的組合構成在存儲賬戶中對象的基位址:

Azure 存儲簡介

2, Access tier(通路層)

Azure Storage根據使用模式的不同,提供了用于通路block blob資料的不同選項。Azure Storage中的通路層(Access Tier)都針對特定的資料使用模式進行了優化,通過選擇合适的通路層,可以以最具成本效益的方式存儲Block Blob資料。

可用的通路層:

  • Hot:用于頻繁通路存儲賬戶中的對象,在hot tier中,通路資料最具有成本效益,而存儲資料的成本則較高。預設情況下,在hot tier中建立新的存儲賬戶。
  • Cool:用于存儲不經常通路,且存儲時間超過30天的大量資料。在Cool tier中存儲資料更具成本效益,而通路資料的成本則較高。
  • Archive:僅用于單個Block Blob,歸檔層可以忍受數小時的檢索延遲,并且資料在歸檔層中至少保留180天。歸檔層最适合存儲長時間通路的資料,但是通路資料是最慢的。

目前,隻有 General-purpose V2 和 BlobStorage支援通路層。

二,Blob存儲

Blob(Binary Large Object,二進制類型的大對象)存儲是Microsoft的雲對象存儲解決方案,Blob存儲經過優化,可存儲大量非結構化資料。 非結構化資料是不遵循特定資料模型或定義的資料,例如文本或二進制資料。

Blob存儲用于:

  • 把圖像或文檔直接提供給浏覽器
  • 存儲檔案以進行分布式通路
  • 流式傳輸視訊和音頻
  • 寫入日志檔案
  • 存儲資料以進行備份和歡迎
  • 存儲資料以on-premises方式進行分析,或Azure 托管服務。

1,Blob存儲的資源

Blob存儲提供三種資源:

  • 存儲賬戶
  • 存儲賬戶中的Container(容器)
  • 容器中的Blob
Azure 存儲簡介

2,容器(Container)

一個容器組織了一組Blob,類似于檔案系統中的目錄(Directory),一個Storage Account可以包含無限數量的容器,一個容器可以存儲無線數量的Blob。

3,Blob

Azure Storage支援三種的Blob:

  • Block blobs :用于存儲文本和二進制資料,塊Blob由可以單獨管理的資料塊構成。
  • Append Blob:對追加操作進行優化的的Blob,特别适合用于記錄日志。
  • Page blobs:存儲随機通路的檔案,Page Blob存儲虛拟硬碟(Virtual Hard Drive,VHD)檔案,并用作Azure VM的硬碟。

三,Azure Data Lake Storage Gen2存儲

Azure Data Lake Storage Gen2(簡稱二代Data Lake)是基于Azure Blob Storage建構的,具有Blob存儲的優點,例如,低成本的分層存儲(tiered storage),高可用性,強一緻性和災難恢複能力等。它也提供了有層次結構的檔案系統(hierarchical file system)。二代Data Lake的核心功能是資料存儲和資料查詢兩個部分,它已經內建于存儲賬号(Storage Account)的功能體系之中。

Azure Data Lake Storage Gen2:有層次結構的檔案系統

“層次結構”和“檔案系統”是反複被強調的Data Lake Storage Gen2的最大特點,也是它有别于傳統Blob對象存儲的最大不同。傳統對象存儲雖然從路徑上看起來也具有“目錄”的虛拟概念,但其實目錄通常并不實際存在,可認為僅是Blob對象路徑字元串中的一部分,因為對象存儲本質上是key-value形式的存儲。而ADLS這樣的“檔案系統”級别的存儲能力上,目錄則是一等公民,可以設定通路權限等中繼資料(并且能夠被子節點繼承),也可以使目錄重命名等操作變得十分便捷迅速。這樣的特性無疑使ADLS更适合作為企業資料湖這樣應用的存儲媒體。

Data Lake Storage Gen2可以向Blob存儲中添加諷刺的名稱空間(hierarchical namespace),分層名稱空間把對象/檔案組織到目錄的分層結構中,以實作高效的資料通路,并使得檔案的管理更加容易,通過目錄和子目錄來組織和操作檔案。

在通常情況下,對象存儲的命名約定是使用名稱中的斜杠來模仿分層目錄結構,比如C:/dir/file.txt,這種結構在Data Lake Storage Gen2中變為現實。重命名或删除目錄之類的操作将成為目錄上的單個原子中繼資料操作。無需枚舉和處理共享目錄名稱字首的所有對象。

在Data Lake Storage Gen2服務中,建立一個容器victest,在容器中建立Folder,或者在容器中存儲file:

Azure 存儲簡介

四,一個服務,多個概念

由于Data Lake Storage Gen2建立在Azure Blob存儲之上,是以多個概念可以描述相同的共享事物。

以下是等效實體,卻使用不同的概念來描述, 除非另有說明,否則這些實體直接是同義詞:

Azure 存儲簡介

參考文檔:

作者

:悅光陰

出處

:http://www.cnblogs.com/ljhdo/

本文版權歸作者和部落格園所有,歡迎轉載,但未經作者同意,必須保留此段聲明,且在文章頁面醒目位置顯示原文連接配接,否則保留追究法律責任的權利。

繼續閱讀