天天看点

《大型网站技术架构》笔记:大型网站核心架构要素

架构 关于什么是架构,一种比较通俗的说法是“最高层次的规划,难以改变的决定”,这些规划和决定奠定了事物未来发展的方向和最终的蓝图。 从这个意义上将,人生规划也是一种架构。选什么学校、学什么专业、进什么公司、找什么对象,过什么样的生活,都是自己的人生架构。 软件架构 软件架构维基百科中如此定义:有关软件整体结构与组件的抽象描述,用于指导大型软件系统各个方面的设计。 系统的各个重要组成部分及其关系构成了系统的架构,这些构成部分可以是具体的功能模块,也可以是非功能的设计与决策,他们相互关联组成一个整体,共同构成了软件系统的架构。 架构五要素 一般来说,除了当前系统功能需求外,软件架构还关注性能、可用性、伸缩性、扩展性和安全性这五个架构要素,架构设计中需要平衡这5个要素之间的关系以实现需求和架构目标,也可以通过考察这些要素以衡量一个软件架构设计的优劣,判断其是否满足期望。 性能 什么是性能: 性能是网站的一个重要指标,除非没得选择(比如只能到12306买火车票),否则用户无法忍受一个响应缓慢的网站。一个打开缓慢的网站会导致严重的用户流失,很多时候网站性能是网站架构升级优化的触发器,任何软件架构设计方案都必须考虑可能会带来的性能问题。

性能衡量指标: 衡量网站性能有一系列指标,重要的有响应时间、TPS、系统性能计数器,通过监控这些参考可以分析系统瓶颈,预测网站容量,并对异常指标进行报警,保障系统可用性。

性能优化手段: 性能问题几乎无处不在,所以优化网站性能的手段也非常多,从用户浏览器到数据库,影响用户请求的所有环节都可以进行性能优化。 1、浏览器:在浏览器端可以通过浏览器缓存、使用页面压缩、合理布局页面、减少Cookie传输等手段改善性能。 2、网络:网络方面可以使用CDN和反向代理。使用CDN将网站静态内容分发至里用户最近的网络服务商机房,使用户通过最短访问路径获取数据。在网站机房部署反向代理服务器,缓存热点文件,加快请求响应速度,减轻应用服务器负载压力。 3、应用服务器:在服务器端可以使用缓存、异步、集群和代码优化等手段。使用服务器本地缓存和分布式缓存,通过缓存在内存中的热点数据处理用户请求,加快请求处理过程,减轻数据库负载压力。通过异步操作将用户请求发送至消息队列等待后续任务处理,而当前请求直接返回响应给用户。在高并发情况下,可以将多台服务器组成一个集群共同对外服务,提高整体处理能力,改善性能。在代码层面可通过使用多线程、改善内存管理等手段优化性能。 4、数据库:在数据库服务器端,索引、缓存、SQL优化等性能优化手段已经比较成熟。而方兴未艾的NoSQL数据库通过优化数据模型、存储结构、伸缩特性等手段在性能方面的优势也日趋明显。 对网站而言,性能符合预期仅仅是必要条件,因为无法预知网站可能会面临的访问压力,所以必须要考察系统在高并发情况下、超出系统负载设计能力的情况下可能会出现的性能问题。网站需要长时间持续运行,必须保证在持续运行且访问压力不均匀的情况下保持稳定的性能特性。

可用性 什么是可用性: 可用性是指网站在7×24小时可正常使用。对于大型网站而言,特别是知名网站,网站宕掉,服务不可用是重大事故,轻则影响网站声誉,重则可能摊上官司。对于电子商务类网站,网站不可用还意味着损失金钱和用户。

高可用设计目标: 网站使用的服务器硬件通常是普通的商用服务器,这些服务器本身并不保证高可用,也就是说,很有可能会出现服务器硬件故障,也就是俗称的宕机。大型网站通常都会有上万台服务器,每天都必定会有一些服务器宕机,因此网站高可用架构设计的前提是必然会出现服务器宕机,而高可用的目标就是当服务器宕机的时候,服务或者应用依然可用。

可用性衡量指标: 几乎所有网站都承诺7×24小时可用,但事实上任何网站都不可能达到完全的7×24小时可用,总会有一些故障时间,扣除这些故障时间就是网站的总可用时间,这个时间可以换算成网站的可用性指标,依次衡量网站的可用性。一些知名的大型网站可以做到4个9以上的可用性,也就是可用性超过99.99%。 衡量一个系统架构设计是否满足高可用目标,就是假设系统中任何一台或者多台服务器宕机时,以及出现各种不可预期的问题时,系统整体是否依然可用。

高可用优化手段: 对于应用服务器而言,多台应用服务器通过通过负载均衡设备组成一个集群共同对外提供服务,任何一台服务器宕机,只需把请求切换到其他服务器就可实现应用的高可用。但是一个前提条件是应用服务器上不能保存请求的会话信息,否则服务器宕机,会话丢失,即使将用户请求转发到其他服务器上也无法完成业务处理。 对于存储服务器,由于其上存储着数据,需要对数据进行实时的备份,当服务器宕机时需要将数据访问转移到可用的服务器上,并对数据恢复以保证继续有服务器宕机的时候数据依然可用。 除了运行环境,软件高可用还需要软件开发过程的质量保证。通过预发布验证、自动化测试、自动化发布、灰度发布等手段,减少将故障引入环境的可能,避免故障范围扩大。

伸缩性 什么是伸缩性: 大型网站需要面对大量用户的高并发访问和存储海量数据,不可能只用一台服务器就处理全部用户请求,存储全部数据。网站通过集群的方式将多台服务器组成一个整体共同提供服务。 所谓伸缩性就是指通过不断向集群中加入服务器的手段缓解不断上升的用户并发访问压力和不断增长的数据存储需求。

衡量伸缩性标准: 衡量架构伸缩性的主要标准就是是否可以用多台服务器构建集群,是否容易向集群中添加新的服务器。加入新的服务器后是否可以提供和原来的服务器无差别的服务。集群中可容纳的总服务器数量是否有限制。

伸缩性优化手段: 对于应用服务器集群,只要服务器上不保存数据,所有服务器都是对等的,通过使用合适的负载均衡设备就可以向集群中不断加入服务器。 对于缓存服务器集群,加入新的服务器可能会导致缓存路由失效,进而导致集群中大部分缓存数据都无法访问。虽然缓存的数据可以通过数据库重新加载,但是如果应用已经严重依赖缓存,可能导致整个网站崩溃。需要改进缓存路由算法保证缓存数据的可访问性。 关系数据库虽然支持数据复制,主从热备等机制,但是很难做到大规模集群的可伸缩性,因此关系数据库的集群伸缩性方案必须在数据库之外实现,通过路由分区等手段将部署由多个数据库的服务器组成一个集群。至于大部分NoSQL数据库产品,由于天生就是为海量数据而生,因此其伸缩性的支持通常都非常好,可以做到在较少运维参与的情况下实现集群规模的线性伸缩。

扩展性 什么是扩展性: 不同于其他架构要素主要关注非业务性需求,网站的扩展性架构设计直接关注网站的业务性需求。网站快速发展,功能不断扩展,如何设计网站的架构使其能够快速响应需求变化,是网站可扩展架构的主要目的。

衡量扩展性标准: 衡量网站架构扩展性好坏的主要标准就是在增加新业务产品时,是否可以实现对现有产品透明无影响,不需要改动或者很少改动既有业务功能就可以上线新产品。不同产品之间是否很少耦合,一个产品改动对其他产品无影响,其他产品和功能不需要受牵连而改动。

扩展性优化手段: 网站可伸缩性架构的主要手段是事件驱动架构和分布式服务。 事件驱动架构在网站通常利用消息队列实现,将用户请求和其他业务事件构造成信息发布到消息队列,消息的处理者作为消费者从消息队列中获取消息进行处理。通过这种方式将消息产生和消息处理分离开来,可以透明地增加新的消息生产者任务或者消息消费者任务。 分布式服务则是将业务和可复用服务分离开来,通过分布式服务器框架调用。新增产品可以调用可复用的服务实现自身的业务逻辑,而对现有产品没有任何影响。可复用服务升级变更的时候,也可以通过提供多版本服务对业务应用实现透明升级,不需要强制业务应用同步变更。

安全性 什么是安全: 互联网是开发的,任何人在任何地方都可以访问网站。网站的安全架构就是保护网站不受恶意访问和攻击,保护网站的重要数据不被窃取。

衡量安全的标准: 衡量网站安全架构的标准就是针对现存在和潜在的各种攻击与窃密手段,是否有可靠的应对策略。