天天看点

Oracle 12.2新特性掌上手册 - 第三卷 Sharding 的增强

编辑手记:sharding技术我们谈了好久,想必大家并不陌生,该功能12.2最新版本中,也将变得越来越完善,今天我们一起来学习。

注:文章内容来自官方文档翻译。若需要了解更多,请查阅官方文档。

1、about sharding

简单来说,oracle的sharding技术就是通过分区(partioning)技术的扩展来实现的。以前一个表的分区可以存在于不同的表空间,现在可以存在于不同的数据库。不同分区存在于不同数据库,这就将数据隔离了开来,sharding就此实现。

Oracle 12.2新特性掌上手册 - 第三卷 Sharding 的增强

sharding是一种数据层架构,其中数据在独立数据库之间进行水平分区。每个数据库托管在专用服务器上,具有自己的本地资源 - cpu,内存,闪存或磁盘。 这种配置中的每个数据库称为分片。 所有的分片一起组成一个逻辑数据库,称为分片数据库(sdb)。水平分区涉及跨分片分割数据库表,以便每个分片包含具有相同列但行的不同子集的表。以这种方式分割的表也称为分片表。

2、benefits of sharding

sharding为最高要求的oltp应用提供线性可扩展性和完整的故障隔离。其主要优点包括:

线性可扩展性。 sharding消除了性能瓶颈,并且可以通过添加分片来线性扩展性能和容量。 故障遏制。分片是一种无共享硬件基础架构,可消除单点故障,例如共享磁盘,san和群集,并提供强大的故障隔离 - 一个分片的故障或减慢不会影响其他分片的性能和可用性。 数据的地理分布。分片使得可以尽量接近消费者进行存储特定数据,并且当数据必须位于特定管辖区时满足监管要求。 滚动升级。一次在一个分片上应用配置更改不会影响其他分片,并允许管理员首先测试对小数据子集的更改。 云部署的简单性。分片非常适合在云中部署,可以根据需要调整大小以适应任何可用的云基础设施,并且仍然实现所需的服务水平。 oracle sharding支持内部部署,云和混合部署模型。

与实现分片的nosql数据存储不同,oracle sharding提供了分片的优点,而不会牺牲企业rdbms的功能。例如,oracle sharding支持:

关系模式 数据库分区 acid属性和读取一致性 sql和其他编程接口 复杂数据类型 在线模式更改 多核可扩展性 高级安全 压缩 高可用性功能 企业级备份和恢复

3、oracle sharding体系结构的组件

oracle sharding是适用于oltp应用程序的可扩展性和可用性功能。它可以在不共享硬件或软件的oracle数据库池中分发和复制数据。应用程序将数据库池视为单个逻辑数据库。应用程序可以通过向池中添加数据库(分片),在任何平台上将数据、事务和用户弹性扩展到任何级别。 oracle 12.2支持扩展到1000个分片。

下图说明了oracle sharding的主要架构组件:

Oracle 12.2新特性掌上手册 - 第三卷 Sharding 的增强
分段数据库(sdb) - 单个逻辑oracle数据库,横跨在没有共享硬件或软件的物理oracle数据库(分片)池中进行水平分区 分片 - 承载分片数据库子集的独立物理oracle数据库 全局服务 - 提供对sdb中数据的访问的数据库服务 shard目录 - 支持自动分片部署,集中管理分片数据库和多分片查询的oracle数据库 分片导向 - 网络侦听器,可根据分片键实现高性能连接路由 连接池 - 在运行时,通过跨池连接路由数据库请求,充当分片导向 管理接口 - gdsctl(命令行实用程序)和oracle企业管理器(gui)

4、关于分片

shards是托管在具有自己的本地资源(cpu,内存和磁盘)的数据库服务器上的独立oracle数据库。在分片之间不需要共享存储。分片数据库是分片的集合。 分片可以放置在一个区域或不同的区域中。 在oracle sharding的环境中,一个区域代表一个数据中心或处于紧密网络邻近的多个数据中心。

可以使用oracle复制技术(如data guard)为ha和dr复制碎片。 对于ha,备用分片可以放置在放置主分片的相同区域。 对于dr,备用分片位于另一个区域。

5、global service(全球服务)

全局服务是对传统数据库服务概念的扩展。传统数据库服务的所有属性都支持全局服务。 对于分片数据库,为全局服务设置了其他属性( 例如数据库角色、复制滞后限制、客户端和分片之间的区域关联性等), 对于读写事务工作负载,创建单个全局服务以从sdb中的任何主分片访问数据。 对于使用adg的高可用性分片,可以创建单独的只读全局服务。

6、shard catalog

shard catalog是一个专用的oracle数据库,它是sdb配置数据的持久存储,并在分片数据库的集中管理中发挥关键作用。所有配置更改(例如添加和删除碎片和全局服务)都在shard catalog上启动。 sdb中的所有ddl都通过连接到shard catalog来执行。

shard catalog还包含sdb中所有重复表的副本,使用实例化视图可以自动将的表更改复制到所有分片中。shard catalog数据库还用于处理不指定分片关键字的分片查询,充当查询协调器。

使用oracle dg实现shard catalog高可用性是建议的最佳做法。shard catalog对sdb的可用性没有影响。shard catalog的中断仅影响在完成自动故障转移到备用 shard  catalog所需的短暂时间内,执行维护操作或多分片查询的功能。 oltp事务继续由sdb路由和执行,并且不受catalog中断的影响。

7、shard director(分片导向)

oracle database 12c引入了全局服务管理器,以根据数据库角色、负载、复制滞后和位置进行路由连接。为了支持oracle sharding,全球服务管理器支持基于数据位置的连接路由。在oracle sharding的环境中,全局服务管理器被称为分片导向。

分片导向是全局服务管理器的特定实现,它充当连接到sdb的客户端的区域侦听器,维护sdb的当前拓扑图,基于在连接请求期间传递的分片键,将连接请求路由到适当的分片。

对于典型的sdb,每个区域的专用低端商用服务器上安装一组碎片导向,若要实现高可用性,可以部署多个分片导向。在oracle 12.2中,可以在给定区域中部署最多5个分片导向.

以下是分片导向的主要功能:

维护有关sdb配置和分片可用性的运行时数据 测量其自身和其他区域之间的网络延迟 作为客户端连接到sdb的区域侦听器 管理全球服务 执行连接负载平衡

今天我们一起来看sharding技术在oracle 12.2最新版本有什么变化?

oracle database 12c版本2(12.2)的分片是一种适用的在线事务处理(oltp)应用程序的架构,其中数据被水平分区到多个分立的oracle数据库(称为分片),这些数据库不共享硬件或软件。分片集合作为单个逻辑数据库呈现给应用程序。

oracle分片支持自动部署,高性能路由和完整的生命周期管理.

通过oracle data guard或oracle goldengate replication进行自动部署,可实现单个分片的高可用性。每个分片是一个oracle数据库,它们具有相同的功能,只有极少数的情况下会作为非分片部署中的oracle数据库。

oracle分片用于为分片式数据库架构显式设计的自定义oltp应用程序。

与基于oracle real application clusters(oracle rac)的架构不同,使用分片的应用程序必须具有明确定义的数据模型和数据分布策略(一致的哈希,范围,列表或组合),主要使用分片键访问数据。密钥的示例包括customer_id,account_no,country_id等。 oracle分片还支持数据放置策略和所有部署模型(例如,本地和公共或混合云)。

oracle 12.2对数据库分片做了许多增强:

1、具有完全故障隔离的线性可扩展性。专为oracle分片而设计的oltp应用程序可以在任何平台上弹性扩展(数据、事务和用户)到任何级别,只需在其他独立服务器上部署新的分片即可。由于计划外中断或计划维护而导致的碎片的不可用性仅影响该碎片的用户;它不会影响其他分片用户的应用程序的可用性或性能。每个分片都可以运行不同版本的oracle数据库,只要应用程序与最早运行的版本向后兼容,即可在执行数据库维护时轻松维护应用程序的可用性。 2、使用许多生命周期管理任务的自动化简单化,包括系统管理分区,单命令部署和细粒度再平衡。 3、使用智能、数据相关的路由提供卓越的运行性能。 4、企业质量(enterprise quality)良好。每个分片是一个oracle数据库,呈现出严格的一致性、sql的全部功能、开发人员与json的敏捷性、以及用于安全性、可用性、备份和恢复以及生命周期管理的久经验证的企业质量(enterprise quality)。

oracle sharding的使用场景

extreme scaling of web-scale oltp databases 规模较大的web-scale 联机事务处理数据库 主要执行单片操作 fault isolation 故障隔离 单个分片出现故障不会导致真个服务器挂掉 geo-data distribution 地理数据分布 使数据更接近消费者以减少延迟 需要满足在公民国家存储用户数据的监管要求

oracle sharded 数据库的完整平台包括:

1、水平分割10,100或1000个不共享硬件或sorware的离散oracle数据库的数据和工作负载

2、自动端到端生命周期管理

    对于单片查询和分片间查询,允许自动分区/复制、弹性扩展、自动平衡、数据相关路由

3、对以下开发商提供企业级数据库平台

明确地设计app与容错线性缩放; 假定使用json的模式灵活性; 从关系型sql和acid的强大力量中产生效益。