天天看点

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

开发者学堂课程【Cassandra数据库入门与实战:持续九年,国际排名第一的宽表数据库概述】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:

https://developer.aliyun.com/learning/course/784

持续九年,国际排名第一的宽表数据库概述

我们正处在一个数据爆炸式增长的时代,随着5g,AI Iot等新兴技术和场景的出现,将加剧数据暴增,数据类型呈现多样化,关系型数据KV、宽表、文档、时序、图数据库等。

这些需求将对数据库领域带来新的挑战,如海量终端及数据导致的高并发、低延时、无线扩展、在线分析、极致可靠性等。

而cassandra就是这样一款,不仅能很好的满足现有应用,又是面向未来,可解决这些新问题的数据库,她也是一款国际上非常流行的数据库,过去12年里,在苹果、脸书、网飞、360、华为等很多国际化大公司都被应用在关键应用场景,在全球上万家企业,也有大规模成熟应用,

一、Apache Cassandra介绍

1、为什么要使用cassandra?

(1)分布式的海量数据储存和处理

(2)极高的性能

(3)极致的可靠性(去中心化的架构,无单点故障)

(4)优秀的线性可扩展能力

(5)对多地多数据中心部署的原生支持

(6)运维和管理需要理解的概念简单

(7)使用对开发者非常友好的类SQL语言CQL

(8)强大的生态,活跃的国际社区

(9)不断紧跟最新技术趋势,使他持续具有强大的生命力

二、学习cassandra的好处

(1)著名招聘网站DICE的年度工资调查,Cassandra一直被列为IT行业十大平均薪酬水平最高的技术之一

(2)对分布式系统的理解和动手能力—校招面试必杀技

(3)跟社区高手学习和交流

(4)提高你在职场的竞争力

二、DBEngine宽表数据库排名第一

4、国际社区的一些统计数据

Fortune前100强的企业90%都在使用cassandra

Linkedln上已有78000 cassandra专业人士,年增长率20%

72%的公司预计今年NoSQL使用会增加

186%增长C docker pulls

167490注册人员—DataStax Academy学院

三、构架基础和原理篇

1、Cassandra的起源

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

2、线性扩展

需要增加存储容量?

需要更多的数据吞吐量?

只要增加节点就好了!

3、Scale up垂直扩展和Scale out水平扩展

(1)垂直扩展需要增加单击硬件资源,最后单机的配置非常昂贵。

(2)水平扩展使用便宜得多的普通硬件资源不够了,只需要加更多的节点就好了。 

4、数据是分布式储存的

5、Cassandra环的工作原理

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

在这个例子里,每一个节点负责一个范围,17号节点负责0到16,33号节点负责17到32,50号节点负责33到49,以此类推。

6、Cassandra多副本

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

7、节点故障

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

8、节点故障—恢复

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述
持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

9、数据的分布可以无处不在

10、CAP定理

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

11、Consistency Levels,一致性级别通常缩写为CL

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

我们在生态环境里边,大多数情况下,我们都会使用RF=3,对于刚开始使用Consistency的人来说,我们建议在生态环境中把复制因子设置为3,让数据库在高可用,高性能之间达到一个最佳的平衡,如果在将来,面对比较特殊的场景,可以考虑换成其他的复制因子。

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

四、应用场景

1、理解cassandra的应用场景

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

首先如果是需要数据库弹性扩展的需求,数据是海量、高吞吐量,有大量的写操作和读操作,像物联网这种应用场景,选择cassandra就是一种完美的选择。

如果需要数据库是高可用性,比如关键任务是不可以有数据丢失的,必须每一秒都在线,也非常适合用Cassandra。

2、各个行业的世界知名品牌都在使用Cassandra

3、典型的应用场景

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

4、苹果 部署规模

5、Facebook/Instagram应用案例

6、纽约证券交易—所每天发生三十六亿手股票交易

五、趋势发展

1、面向未来的数据架构

持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述
持续九年,国际排名第一的宽表数据库概述|学习笔记持续九年,国际排名第一的宽表数据库概述

我们现在正在设计一个面向未来的一种数据架构,这个核心还可以是cassandra,在这个基础之上,我们希望应用程序和开发语言,能够解放出来,能够让他们使用他们最拿手的应用