数据分区设计(0)-前言

2022-09-04 05:56:08

对大数据集或非常高吞吐量，仅复制还不够，还需将数据拆分，成为分区（partitions），也称分片（sharding）1。

分区 (partition)，对应MongoDB、ES中的shard，HBase 的Region，Bigtable的tablet，Cassandra的vnode，Couchbase的vBucket。但分区 (partitioning)更普遍。

每条数据（或每条记录，每行或每个文档）属于且仅属于某特定分区。每个分区都能视为一个完整小型数据库，虽然数据库可能存在跨分区操作。

提高可扩展性。不同分区可放在一个无共享集群的不同节点。这样的一个大数据集可分散在更多磁盘，查询负载也随之分布到更多处理器。

继续阅读