高性能数据库连接池的内幕

大家可能会有这样疑问：连接池类似于线程池或者对象池，就是一个放连接的池子，使用的时候从里面拿一个，用完了再归还，功能非常简单，有什么可讲的。

可能还会有这样的疑问：高性能这么高大上，一个小小的连接池，如何跟高大上靠上边的。

本主题将会全面介绍连接池原理，高性能的设计，优化实践，现有连接池的瓶颈及解决方案。同时也会介绍唯品会自研数据库连接池产品(代号：caelus)

先看一下连接池所处的位置：

应用框架的业务实现一般都会访问数据库，缓存或者http服务。为什么要在访问的地方加上一个连接池呢？

下面以访问mysql为例，执行一个sql命令，如果不使用连接池，需要经过哪些流程。

tcp建立连接的三次握手

mysql认证的三次握手

真正的sql执行

mysql的关闭

tcp的四次握手关闭

可以看到，为了执行一条sql，却多了非常多我们不关心的网络交互。

优点：实现简单。

缺点：

网络io较多

数据库的负载较高

响应时间较长及qps较低

应用频繁的创建连接和关闭连接，导致临时对象较多，gc频繁

在关闭连接后，会出现大量time_wait 的tcp状态（在2个msl之后关闭）

第一次访问的时候，需要建立连接。但是之后的访问，均会复用之前创建的连接。

优点：

较少了网络开销

系统的性能会有一个实质的提升

没了麻烦的time_wait状态

当然，现实往往是残酷的，当我们解决了一个问题的时候，同时伴随着另外一个问题的产生。

使用连接池面临的最大挑战： 连接池的性能

分库db部署结构：

假设有128个分库：32个服务器，每个服务器有4个schema。按照128个分库的设计，便会新建128个独立数据库连接池。

数据库连接池的模型

特点：

128个连接池完全独立，不同的schema也对应不同的连接池。

先通过拆库，读写等策略选择对应的连接池，再从连接池获取一个连接进行操作。

操作完后，再将连接归还到对应的连接池中。

结构简单，分散竞争

面临的问题：

1：线程数过多

先看一下新建一个连接池，需要新建的线程数的个数。

连接池

线程数

128个分库需要的线程数

c3p0

3个helperthread (pollerthread)，1个定时任务admintasktimer(deadlockdetector)

4*128=512

dbcp

负责心跳，最小连接数维持，最大空闲时间和防连接泄露

1*128=128

druid

一个异步创建连接。一个异步关闭连接。

2*128=256

可以看到随着分库的增加，不管选用哪个连接池，线程的个数均会线性增长。线程数过多将会导致内存占用较大: 默认1个线程会占用1m的空间，如果是512个线程，则会占用1m*512=512m上下文切换开销。

tips：由于stack和heap申请为虚地址空间，但是一旦使用就不会释放。(线程也不一定会占用1m的空间)

2：连接数过多

数据库的连接资源比较重，并且随着连接的增加，数据库的性能会有明显的下降。dba一般会限制每个db建立连接的个数，比如限制为3k 。假设数据库单台限制3k，32台则容量为3k*32=96k。如果应用最大，最小连接数均为10，则每个应用总计需要128*10=1.28k个连接。那么数据库理论上支持的应用个数为96k/1.28k= 80 台

3：不能连接复用

同一个物理机下面不同的schema完全独立，连接不能复用

优化后的数据库连接池模型

只有一个连接池,所有节点共享线程（解决了线程数过多的问题）

每个物理机对应一个host, host里面维护多个schema，schema存放连接。

同一个host下面的不同schema 可以进行连接复用(解决连接数过多的问题)

获取连接流程：

获取连接需要带上 ip,port和schema信息：比如获取的是host31的schema1

先到host31的schema1中获取空闲连接，但是schema1无空闲连接，便会从schema2中获取空闲连接。

从schema2中获取的连接执行useschema1，该连接便切换到schema1上面。

执行对应的sql操作，执行完成后，归还连接到schema1的池子里面。

连接复用：有效减少连接数。

提升性能：避免频繁的新建连接。新建连接的开销比较大，而使用use schema开销非常小

有效减少线程数。按现有方案大概只需要4个线程即可。而优化前需要512个线程

管理较为复杂

不符合jdbc接口规范。datasource只有简单的getconnection()接口，没有针对获取对应schema的连接的接口。需要继承datasouce，实现特定接口。

优化前执行事务的模型

从连接池里面获取到连接，默认是自动提交。为了开启事务，需要执行setautocommit=false 操作，然后再执行具体的sql，归还连接的时候，还需要将连接设置为自动提交(需要执行set autocommit=true) 。可以看到开启事务，需要额外执行两条事务的语句。

优化后执行事务的模型

每个schema里面所有的连接会按照autocommit进行分组。分为自动提交(autocommit=true) 和非自动提交(autocommit=false)。获取连接时优先获取相同autocommit的分组里的连接，如果没有可用连接则从另外一个分组中获取连接，业务操作执行完后，再归还到对应的分组里面。该种机制避免了开启事务多执行的两条事务语句。

连接池主要包含五部分：获取连接，归还连接，定时任务，维护组件及资源池

获取连接：

获取超时：如果超过规定时间未获取到连接，则会抛出异常

有效性检查：当从资源池里面获取到资源，需要检查该资源的有效性，如果失效，再次获取连接。避免执行业务的时候报错。

创建连接：可以同步创建，也可以异步创建。

归还连接：

归还连接：比如需要检查最大空闲数，确定是物理关闭还是归还到连接池

销毁连接: 可同步销毁也可异步销毁

定时任务：

空闲检查：主要是检查空闲连接，连接空闲超过一定时间，则会关闭连接。

最小连接数控制：一般会设置最小连接数。保证当前系统里面最小的连接数。如果不够，则会新建连接。

组件维护：

连接状态控制：空闲，使用，删除等状态控制

异常处理：对jdbc访问的异常统一处理，如果异常与连接相关，则会将该连接销毁掉。

缓存：避免对sql重复解析，preparestatement机制下，会对sql解析的对象进行缓存。

jdbc封装：对jdbc进行了实现，真正的实现是底层的driver,比如mysql-connector-java 。

资源池：

资源池是存放连接的地方，也是连接池最核心的地方。

所有的组件基本上都与资源池进行交互，对连接资源的竞争非常激烈。该处的性能将决定了整个连接池的性能。

一般资源池的实现是使用jdk提供的blockingqueue。那么是否有方案可以进行无锁的设计，来避免竞争。

获取连接大概流程：

从threadlocal里面获取连接，如果没有空闲连接，则从全局连接池(copyonwritearraylist)中获取。

如果全局连接池中没有空闲连接，则会异步新建连接。

判定超时时间是否大于阈值，如果小于阈值，则进行自旋。否则进行park休眠。

连接建立成功后，会对park的线程进行唤醒

主要从四个方面实现了无锁的设计：threadlocal,copyonwritearraylist，异步建立连接及自旋。

threadlocal

每个线程均有一个连接队列。该队列是全局队列的引用。

获取连接时先从threadlocal里面拿连接，如果连接是空闲状态，则使用。否则移除掉，再拿下一个，直到拿不到连接为止。

归还连接时，只需要归还到threadlocal的队列里面，同时设置连接为空闲状态

如果使用blockqueue,获取连接时调用poll,归还连接时调用offer，存在两次锁的竞争。优化后通过cas避免了两次锁的开销(获取连接时，使用cas置连接为非空闲状态；归还时，使用cas置连接为空闲状态)

copyonwritearraylist

该队列使用场景是：大量读，少量写的操作，并且存储的数据比较有限。而连接池的场景非常适合采用copyonwritearraylist。

在获取连接或者归还连接时，只会通过cas更改连接的状态，不会对连接池进行添加或者删除的操作。

一般连接池连接的个数比较可控，copyonwritearraylist在写操作时会对所有连接进行拷贝，对内存影响不大。

异步建立连接

获取到连接后，判断一下是否有并发正在等待获取连接，如果有，则异步建立连接。避免下一个连接的等待。如果copyonwritearraylist没有空闲连接，则异步建立连接。

自旋

该自旋比较类似于jdk对synchronized的自旋机制。如果发现超时时间大于设定的阈值(比如10微秒)，则会进行线程挂起。如果小于设定的阈值，则重新获取连接，进行自选，避免线程的上下文切换带来的性能开销。

方法内联优化

每调用一次方法，线程便会新建一个栈帧，新建栈帧开销相对比较大

jit在运行时会进行内联优化，多个方法使用一个栈帧，避免栈帧新建过多

jit方法内联优化默认的字节码个数阈值是35个字节，低于35个字节，才会进行优化。(可通过-xx:maxinlinesize=35进行设置)

通过修改上述代码，编译后字节码修改到34个字节，则可以满足内联的条件。

心跳语句选择

preparestatement模式选择

mysql driver默认是client模式，如果需要开启server模式，需要设置 useserverprepstmts=true 。preparestatement默认的client模式和statement对于db端没有区别。大家普遍理解preparestatement和statement的区别是preparestatement可以避免sql注入。但是避免sql注入是如何做到的？

使用preparestatement设置参数的时候，比如调用setstring(int parameterindex, string x)，本地会对设置的参数进行转义来避免sql注入。

执行sql的时候，会将sql的?替换成转义后的字符，发送到数据库执行。

pscache

mysqldriver 默认不开启，可通过设置 cacheprepstmts = true 进行开启

querytimeout

之前也遇到因为开启了querytimeout，导致连接泄露的问题。

具体可参考：

mysql driver的bug发现之旅：

<a target="_blank" href="http://blog.csdn.net/hetaohappy/article/details/52091005">http://blog.csdn.net/hetaohappy/article/details/52091005</a>

关于连接池的最优配置之前做过整理，可参考：

<a target="_blank" href="http://blog.csdn.net/hetaohappy/article/details/51861015">http://blog.csdn.net/hetaohappy/article/details/51861015</a>

caelus是唯品会自研的高性能的分布式的数据库连接池。

高性能：基于无锁的连接池设计模型来提升连接池性能；

在分库较多的场景下，减少线程数。假如有128个分库，现有连接池模型下则需要使用128个独立的连接池，每个连接池都需要线程(1-4个，不同的连接池不同)处理任务。则总共需要维护128到128*4个线程，开销巨大。而caelus连接池会大大减少线程数。

连接复用。对于一个mysql 的instance上面有多个schema场景下。现有连接池不同的schema的连接不可复用。而caelus可以复用不同schema的连接，提升性能。

过多的事务指令。如果是事务语句，则从连接池拿到连接后，需要先开启事务(setautocommit=false)，归还时需要再设置(set autocommit=true)。每使用一次连接，均需要额外执行两条事务指令。caelus能有效减少事务指令。

配置规范的统一。结合mysql的设置，提供规范统一，最优的配置。

本主题讲解了数据库连接池的性能设计优化。关于缓存(memcache，redis)

和http连接池的优化实践，后面有机会再和大家一块沟通学习。

关于netty的纯异步http连接池设计，可参考：

<a target="_blank" href="http://blog.csdn.net/hetaohappy/article/details/51867059">http://blog.csdn.net/hetaohappy/article/details/51867059</a>

作者简介：

何涛，现任职于唯品会平台架构部，要负责数据访问层，网关，数据库中间件，平台框架等开发设计工作。在数据库性能优化，架构设计等方面有着大量的经验积累。热衷于高可用，高并发及高性能的架构研究。

本文转载自微信公众号中生代技术 freshmantechnology

高性能数据库连接池的内幕

继续阅读

neo4j之cypher使用文档

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

NOSQL安全攻击

mybatis_入门程序Mybatis入门

mysql使用source命令导入.sql文件

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

登录plsql 报错 the account is locked --用户被锁

sqlServer根据经纬查距离

Effective Java 8:通用程序设计

SequoiaDB巨杉数据库C++驱动概述

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method