架构设计之高可扩展性（上）

高可扩展性表示可通过加机器线性提高系统处理能力，承担更高流量和并发。

由于峰值的流量不可控，不可能在系统架构设计初期就考虑好机器数量以支持并发。

一般基于成本考虑，在业务平稳期，会预留30%～50%冗余机器应对运营活动或者推广可能带来的峰值流量，但当有突发事件时，流量可能瞬间提升几倍。莫过于明星公布恋情，大家都会到两人微博下互动，微博流量短时内迅速增长，微博信息流也短暂出现无法刷新消息，系统一时间不可用。

所以如何应对突发的流量呢？

最快的方式就是堆机器。不过能保证扩容三倍机器后，系统也能支撑三倍的流量吗？

系统瓶颈在哪里？

通过在单机系统中增加处理核心，可增加系统的并行处理能力，但当并行任务数较多时，系统会因为争抢资源而达到性能拐点，处理能力不升反降。

集群系统也是这样。不同的系统分层上可能存在一些“瓶颈”，这些瓶颈点制约着统的横向扩展能力。

比如系统流量1000 QPS，对DB也是1000 QPS。若流量增加10倍，虽然系统可通过扩容正常服务，DB却成瓶颈。或单机网络带宽50Mbps，若扩容到30台机器，前端负载均衡带宽就超过千兆带宽限制，也会成为瓶颈点。

所以系统中存在哪些服务会成为系统扩展的瓶颈呢？

无状态的服务和组件很易于扩展，但是MySQL这种存储服务有状态，较难扩展。因为向存储集群中增减机器时，涉及大量数据迁移，一般关系型DB都不支持。

DB、缓存、依赖的第三方、负载均衡、交换机带宽等都是系统扩展时需考虑因素。得清楚系统并发达到某量级后，哪个因素会成为系统瓶颈点，从而对症下药。

高可扩展性设计

拆分，把庞杂系统拆分成独立、单一职责的模块。

注意对不同类型模块，拆分原则不同。假如设计一个知乎，那么会有几个模块呢？至少5个模块。

用户：负责维护社区用户信息，注册，登陆等；

关系：用户之间关注、好友、拉黑等关系的维护；

内容：社区发的内容，就像朋友圈或者微博的内容；

评论、赞：用户可能会有的两种常规互动操作；

搜索：用户的搜索，内容的搜索。

部署方式遵照最简单三层部署架构

负载均衡负责请求的分发

应用服务器负责业务逻辑的处理

数据库负责数据的存储落地

所有模块的业务代码混合，数据也都存在一个库。

存储层的扩展性

无论是存储数据量，还是并发访问量，不同业务模块间量级相差很大。

比如知乎，关系数据量远大于用户数据量，但用户数据的访问量却远比关系数据大。所以假如存储目前的瓶颈点是容量，那只需针对关系模块的数据做拆分，而无需拆分用户模块数据。所以存储拆分首先考虑业务维度。

拆分后，这简单社区系统就有用户库、内容库、评论库、点赞库和关系库。这还能隔离故障，某库挂了不会影响到其它DB。

按DB业务拆分后的部署架构

业务拆分一定程度提升了系统扩展性，但运行久后，单一业务DB在容量和并发请求量上仍会超过单机限制。需针对DB做二次拆分。

这次拆分按照数据特征做水平的拆分，比如给用户库增加俩节点，然后将用户数据拆分库。

水平拆分后，即可突破单机限制。不能随意地增加节点，因为一旦增加节点就需手动迁移数据。所以长远考虑最好一次增加足够节点，避免频繁扩容。

当DB按业务和数据维度拆分后，尽量不要使用事务。因为当一个事务同时更新不同DB，需使用二阶段提交，来协调所有DB要么全部更新成功，要么全部更新失败。

架构设计之高可扩展性（上）

继续阅读

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

Linxu常用命令技巧汇总

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艰难安装LDAP,SSL认证

《Linux命令行与Shell脚本编程大全第2版.布卢姆》pdf

MySQL的4种隔离级别？出现问题

nginx location中斜线的位置的重要性

XX系统实施过程问题总结

无组件上传图片到数据库中，最完整解决方案

【MySQL数据库】数据库索引事务1.索引2.事务

neo4j之cypher使用文档

NOSQL安全攻击

mybatis_入门程序Mybatis入门

mysql使用source命令导入.sql文件

登录plsql 报错 the account is locked --用户被锁

SequoiaDB巨杉数据库C++驱动概述