天天看點

MongoDB資料庫基礎教程(二) - 資料結構類型詳解(下)文檔(Document)集合

文檔(Document)

文檔是一組鍵值(key-value)對(即 BSON).

MongoDB 的文檔不需要設定相同的字段,并且相同的字段不需要相同的資料類型,這與關系型資料庫有很大的差別,也是MongoDB 非常突出的特點。

一個簡單的文檔例子如下:

{“site”:“

https://github.com/Wasabi1234/Java-Interview-Tutorial

”, “name”:“JavaEdge”}

下表列出了 RDBMS 與 MongoDB 對應的術語:

MongoDB資料庫基礎教程(二) - 資料結構類型詳解(下)文檔(Document)集合

在mongodb中是通過資料庫、集合、文檔的方式來管理資料,下邊是mongodb與關系資料庫的一些概念對比:

MongoDB資料庫基礎教程(二) - 資料結構類型詳解(下)文檔(Document)集合

注意

  • 文檔中的鍵/值對是有序的。
  • 文檔中的值不僅可以是在雙引号裡面的字元串,還可以是其他幾種資料類型(甚至可以是整個嵌入的文檔)
  • MongoDB區分類型和大小寫
  • MongoDB的文檔不能有重複的鍵
  • 文檔的鍵是字元串。除了少數例外情況,鍵可以使用任意UTF-8字元。

文檔鍵命名規範:

鍵不能含有\0 (空字元)。這個字元用來表示鍵的結尾。

.和$有特别的意義,隻有在特定環境下才能使用。

以下劃線"_"開頭的鍵是保留的(不是嚴格要求的)。

集合

集合就是 MongoDB 文檔組,類似于 RDBMS 中的表格。

集合存在于資料庫中,集合沒有固定的結構,這意味着你在對集合可以插入不同格式和類型的資料,但通常插入集合的資料都會有一定的關聯性。

比如,我們可以将以下不同資料結構的文檔插入到集合中:

{“site”:“www.baidu.com”}

{“site”:“www.google.com”,“name”:“Google”}

”,“name”:“JavaEdge”,“num”:5}

當第一個文檔插入時,集合就會被建立。

合法的集合名

集合名不能是空字元串""。

集合名不能含有\0字元(空字元),這個字元表示集合名的結尾。

集合名不能以"system."開頭,這是為系統集合保留的字首。

使用者建立的集合名字不能含有保留字元。有些驅動程式的确支援在集合名裡面包含,這是因為某些系統生成的集合中包含該字元。除非你要通路這種系統建立的集合,否則千萬不要在名字裡出現$。 

如下執行個體:

db.col.findOne()

capped collections

Capped collections 就是固定大小的collection。

它有很高的性能以及隊列過期的特性(過期按照插入的順序). 有點和 “RRD” 概念類似。

Capped collections 是高性能自動的維護對象的插入順序。它非常适合類似記錄日志的功能和标準的 collection 不同,你必須要顯式的建立一個capped collection,指定一個 collection 的大小,機關是位元組。collection 的資料存儲空間值提前配置設定的。

Capped collections 可以按照文檔的插入順序儲存到集合中,而且這些文檔在磁盤上存放位置也是按照插入順序來儲存的,是以當我們更新Capped collections 中文檔的時候,更新後的文檔不可以超過之前文檔的大小,這樣話就可以確定所有文檔在磁盤上的位置一直保持不變。

由于 Capped collection 是按照文檔的插入順序而不是使用索引确定插入位置,這樣的話可以提高增添資料的效率。MongoDB 的記錄檔檔案 oplog.rs 就是利用 Capped Collection 來實作的。

要注意的是指定的存儲大小包含了資料庫的頭資訊。

db.createCollection(“mycoll”, {capped:true, size:100000})

在 capped collection 中,你能添加新的對象。

能進行更新,然而,對象不會增加存儲空間。如果增加,更新就會失敗 。

使用 Capped Collection 不能删除一個文檔,可以使用 drop() 方法删除 collection 所有的行。

删除之後,你必須顯式的重新建立這個 collection。

在32bit機器中,capped collection 最大存儲為 1e9( 1X109)個位元組。

中繼資料

資料庫的資訊是存儲在集合中。它們使用了系統的命名空間:

dbname.system.*

在MongoDB資料庫中名字空間 .system.* 是包含多種系統資訊的特殊集合(Collection),如下:

集合命名空間 描述

dbname.system.namespaces 列出所有名字空間。

dbname.system.indexes 列出所有索引。

dbname.system.profile 包含資料庫概要(profile)資訊。

dbname.system.users 列出所有可通路資料庫的使用者。

dbname.local.sources 包含複制對端(slave)的伺服器資訊和狀态。

對于修改系統集合中的對象有如下限制。

在{{system.indexes}}插入資料,可以建立索引。但除此之外該表資訊是不可變的(特殊的drop index指令将自動更新相關資訊)。

{{system.users}}是可修改的。 {{system.profile}}是可删除的。

MongoDB 資料類型

下表為MongoDB中常用的幾種資料類型。

資料類型 描述

String 字元串。存儲資料常用的資料類型。在 MongoDB 中,UTF-8 編碼的字元串才是合法的。

Integer 整型數值。用于存儲數值。根據你所采用的伺服器,可分為 32 位或 64 位。

Boolean 布爾值。用于存儲布爾值(真/假)。

Double 雙精度浮點值。用于存儲浮點值。

Min/Max keys 将一個值與 BSON(二進制的 JSON)元素的最低值和最高值相對比。

Array 用于将數組或清單或多個值存儲為一個鍵。

Timestamp 時間戳。記錄文檔修改或添加的具體時間。

Object 用于内嵌文檔。

Null 用于建立空值。

Symbol 符号。該資料類型基本上等同于字元串類型,但不同的是,它一般用于采用特殊符号類型的語言。

Date 日期時間。用 UNIX 時間格式來存儲目前日期或時間。你可以指定自己的日期時間:建立 Date 對象,傳入年月日資訊。

Object ID 對象 ID。用于建立文檔的 ID。

Binary Data 二進制資料。用于存儲二進制資料。

Code 代碼類型。用于在文檔中存儲 JavaScript 代碼。

Regular expression 正規表達式類型。用于存儲正規表達式。

下面說明下幾種重要的資料類型。

ObjectId

ObjectId 類似唯一主鍵,可以很快的去生成和排序,包含 12 bytes,含義是:

前 4 個位元組表示建立 unix 時間戳,格林尼治時間 UTC 時間,比中原標準時間晚了 8 個小時

接下來的 3 個位元組是機器辨別碼

緊接的兩個位元組由程序 id 組成 PID

最後三個位元組是随機數

MongoDB 中存儲的文檔必須有一個 _id 鍵。這個鍵的值可以是任何類型的,預設是個 ObjectId 對象

由于 ObjectId 中儲存了建立的時間戳,是以你不需要為你的文檔儲存時間戳字段,你可以通過 getTimestamp 函數來擷取文檔的建立時間:

var newObject = ObjectId()

newObject.getTimestamp()

ISODate(“2017-11-25T07:21:10Z”)

ObjectId 轉為字元串

newObject.str

5a1919e63df83ce79df8b38f

字元串

BSON 字元串都是 UTF-8 編碼。

時間戳

BSON 有一個特殊的時間戳類型用于 MongoDB 内部使用,與普通的 日期 類型不相關。 時間戳值是一個 64 位的值。其中:

前32位是一個 time_t 值(與Unix新紀元相差的秒數)

後32位是在某秒中操作的一個遞增的序數

在單個 mongod 執行個體中,時間戳值通常是唯一的。

在複制集中, oplog 有一個 ts 字段。這個字段中的值使用BSON時間戳表示了操作時間。

BSON 時間戳類型主要用于 MongoDB 内部使用。在大多數情況下的應用開發中,你可以使用 BSON 日期類型。

日期

表示目前距離 Unix新紀元(1970年1月1日)的毫秒數。日期類型是有符号的, 負數表示 1970 年之前的日期。

var mydate1 = new Date() //格林尼治時間

mydate1

ISODate(“2018-03-04T14:58:51.233Z”)

typeof mydate1

object

var mydate2 = ISODate() //格林尼治時間

mydate2

ISODate(“2018-03-04T15:00:45.479Z”)

typeof mydate2

這樣建立的時間是日期類型,可以使用 JS 中的 Date 類型的方法。

傳回一個時間類型的字元串:

var mydate1str = mydate1.toString()

mydate1str

Sun Mar 04 2018 14:58:51 GMT+0000 (UTC)

typeof mydate1str

string

或者

Date()

Sun Mar 04 2018 15:02:59 GMT+0000 (UTC)