1.为什么叫mycat
其实mycat在最早的初期版本只支持mysql一种数据库,换句话说mycat其实就是mysql的增强版
在mysql中只是数据库,并没有读写分离和分库分表,这些操作全部都是由mycat进行实现
!!!!!主从复制(数据同步)功能mycat没有,必须要使用mysql所提供的!!!!!
2.什么是mycat
2.1.mycat是开源的 并且面向大型企业的大数据库集群
2.2.支持事务、ACID、可以替代MySQL的加强版数据库,目前为止已经支持了很多数据库(内存数据库(NOSQL:redis,mongoDB…),关系型数据库一样支持(MySQL、Oracle、DB2、SQL Server、PostgreSQL…))
2.3.代替了昂贵的oracle(Oracle在四年前单节点一年10万块,在那个时候mysql比较弱!!!)
2.4.mycat是一个HDFS大数据的新型SQL Server(SQL引擎,SQL服务器)
其实mycat沿用了Hadoop的HDFS概念–>只是mycat把F变为了D
3.什么是HDFS
H:Hadoop
D:Distributed
F:File
S:System
Hadoop(大数据)的分布式文件存储系统
什么是大数据:
数据量非常大!!!!并且以文件的形式保存称之为大数据
mycat:
H:High(Big Data)
D:Distributed
D:Data(关系型数据库中所保存的数据)
S:System
4.mycat的两大核心:分库分表,读写分离
分库分表
4.1.什么是分库分表
在同一个系统(项目)中,把一张数据比较多的表放到不同的集群节点上,这种模式就称之为分库分表
4.2.需求
使用mycat实现分库分表(HDFS:namenode datanode secondarynamdenode)
在整个mycat中也会使用到namenode和datanode
mysql01服务器(linux)192.168.23.129:
mysql数据库
teach(真实的库)
student(表)
mysql02服务器(linux)192.168.23.130:
mysql数据库
teach(真实的库)
student(表)
使用mycat(192.168.23.164)把数据分别存放在两个student中,也就是说这两张student表合在一起才是一个完整的数据表
mycat --> mysql01存入一条数据
mycat --> mysql02存入一条数据
依次交替
4.3.配置mycat
4.3.1.规定linux的用户名和全名不能叫mycat!!!否则mycat会不生效(原因是影响整个linux系统的环境变量导致mycat的配置环境变量没有生效)
4.3.2.vim /etc/sysconfig/network也不能叫mycat
4.3.3.mycat使用的是Java语言编写-->所以必须要在linux上配置jdk(要求jdk必须为64位,因为mycat是在64位的jdk8上进行编译的)
4.3.4.配置jdk
4.3.5.使用xftp把mycat的压缩包上传到linux服务器上
4.3.6.解压mycat压缩包
tar -zxvf xxxxx
4.3.7.配置mycat的环境变量
也要进入
vim /etc/profile
在文档的后面配置
export MYCAT_HOME=mycat安装的地址
在exprot PATH后面要配置上
$MYCAT_HOME/bin
这个配置必须配置在PATH的上面,不然会加载错误!!!
-
3.7.1 进入mycat的从conf目录
mycat的三个核心配置文件
所有的读写分离/分库分表都必须要在这三个配置文件完成
mycat的conf目录
第一:配置server.xml目录,只需配置user标签里内容就行
server.xml:
配置了mycat的用户(账号:root 密码:root) --> 账号和密码 可以根据情况随意更改
user标签的name=‘root’就是你的登陆数据库的账号:一般用root
property标签的name=password 就是你的登陆密码,视自己情况而定。
property标签的name=schemas 这个是你数据库的名字,schemas中的配置和mysql的数据库可以一样,也可以不一样
mycat也是可以直接使用数据库连接软件进行连接的
整个user标签中就是配置了mycat的账号和密码
name===》就是mycat的账号
defaultAccount====》表示该账号为管理员账号,而且只能出现一次
property:属性标签
password===》就是name的密码
无论是账号还是密码都可以随意定制,开心就好!!!
readOnly:只读(该账号只能查询数据,不能写入数据)
schemas:指向的是mycat的数据库(mycat的虚拟库!!!这个库并不是真实存在的, 是需要,通过mysql的数据库进行映射的),一个mycat中可以有多个schema
隐藏mysql的真实库的名字
连接mysql:
jdbc:mysql:localhost:3306/数据库名
连接mycat:
jdbc:mysql:ip地址:端口号/mycat的虚拟库名
这个server.xml 只需要配置user标签下的内容就可以了。
<user name="root" defaultAccount="true">
<property name="password">123456</property>
<property name="schemas">TEACH</property>
</user>
第二步:配置rule.xml:
mycat的规则
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License");
- you may not use this file except in compliance with the License. - You
may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0
- - Unless required by applicable law or agreed to in writing, software -
distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT
WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the
License for the specific language governing permissions and - limitations
under the License. -->
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/">
<!--
所有的规则配置一个tableRule对应一个function,如果需要进行配置必须要配置一对,
不能单独配置一个(如果单独配置了一个的情况下,mycat启动的时候会直接报错)
一共有十种规则:
·在这里我们只用到这一种,所以只配置这一种就可以了,其他没用 的可以删掉
mod-long:(轮询)
mysql01
mysql数据库
teach
student
mysql02
mysql数据库
teach
student
当客户端发送请求===插入数据===》mycat===请求mysql===》
会把第一条数据插入进mysql01,
会把第二条数据插入进mysql02
依次循环
-->
<tableRule name="mod-long">
<rule>
<columns>id</columns>
<algorithm>mod-long</algorithm>
</rule>
</tableRule>
<function name="mod-long" class="io.mycat.route.function.PartitionByMod">
<!--
代表了datanode的节点数量
如果只有两台datanode就必须要写2
-->
<property name="count">2</property>
</function>
</mycat:rule>
第三步:配置schema.xml:
实现了读写分离和分库分表的具体配置
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<!--
!!!schema标签的name属性值必须要和server.xml中的schames保持一致!!!
schema就类似于mysql的数据库
checkSQLschema:检查SQL语句是否错误(select * from user wher id = 1)
默认值为false,不需要改为true,把对SQL语句的检查交给mysql处理
sqlMaxLimit:最大执行SQL语句的数量
一次性可以执行多少条SQL语句
在schame标签中有table标签,这个标签就是定义了mycat中的表
类似于mysql数据库中的表
和mysql中的表名可以重复也可以不一致
dataNode:数据节点
在HDFS中存放数据
在mycat中映射的就是真实mysql数据库(可以有多个,也可以只有一个),名字可以随意起
今天的目标是实现分库分表,需要用到两台mysql数据库,所以只需要配置dn1和dn2
rule:配置规则
配置一定要和rule.xml中保持一致
-->
<schema name="TEACH" checkSQLschema="false" sqlMaxLimit="100">
<!-- auto sharding by id (long) -->
<table name="mycat_student" dataNode="dn1,dn2" rule="mod-long" />
</schema>
<!--
datanode标签对应的是table标签中的datanode属性
也就是说datanode属性值必须要和dataNode的标签name属性值保值一致
dn1:代表了mysql01服务器==》mysql数据库
dn2:代表了mysql02服务器==》mysql数据库
dataHost:才是真正的配置了分库分表和读写分离的核心配置
database:映射的是真实mysql的数据库名
-->
<dataNode name="dn1" dataHost="localhost1" database="mysql01" />
<dataNode name="dn2" dataHost="localhost2" database="mysql02" />
<!--
dataHost标签必须要和dataNode标签中的dataHost属性保持一致
如果dataHost属性名重复了,映射的是同一个dataHost
每一个dataHost标签就是一个真实的mysql数据库
maxCon:最大连接数
minCon:最小连接数
balance:负载均衡
writeType:写入的类型(读写分离使用)
switchType:转换的类型(读写分离所使用的数据)
dbType:数据库的类型(在最早的版本mycat只支持mysql一种数据库,
后来发展支持很多种数据库)
dbDriver:数据库驱动(使用本地驱动,使用的是mycat所提供的驱动)
master:主节点
slave:从节点
threshold:入口
-->
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<!--
heartbeat:心跳
mycat一直在监视mysql的user表(心跳),
如果一旦发现mysql的user不再有心跳,就会认为这一台mysql处于宕机状态,
也就不会再向这一台mysql进行做增删改查的操作
-->
<heartbeat>select user()</heartbeat>
<!--
writeHost:标签是该台mysql数据库为读和写的数据库
readHost:标签是该台mysql数据库为读的数据库
writeHost如果单独存在,标识该台mysql数据库为读和写的操作
如果一旦和readHost一起使用,writeHost就只能做些的操作,
所有的读操作都使用readHost完成
readHost必须要配置在writeHost的内容,不允许单独存在
host:属性只是标识了该台数据库的操作的内容,可以随意定义
url:数据库的url
jdbc:mysql://localhost:3306
!!!!!如果配置了两个writeHost,那么host的值就必须不能重复!!!!!
-->
<writeHost host="write01" url="192.168.23.129:3306" user="root"
password="root" />
</dataHost>
<dataHost name="localhost2" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="write02" url="192.168.23.130:3306" user="root"
password="root" />
</dataHost>
<!--
mycat中所映射的真实mysql的表必须要mycat所声明的table的名字保持一致
也就是说mycat的表名必须要和mysql的表名一模一样,否则映射不到
-->
</mycat:schema>
其实mycat也可以看成是一个数据库,只是这个数据库是虚拟的,把真实的mysql数据中的表数据映射进了虚拟库中,使用Java项目连接的时候只需要连接mycat即可,不再需要连接mysql
4.3.8.启动mycat
进入mycat的bin目录
./mycat console
或者在任意的位置直接使用
mycat console
console | start | stop | restart | status | dump
启动mycat:
mycat console 类似于IDEA中控制台,mycat会把日志打印出来
mycat start 就是正常启动
一般情况下推荐使用console启动
一旦启动mycat就关不掉,kill -9关不掉 除非重启或者关机
看到以下信息说明启动成功:
jvm 1 | MyCAT Server startup successfully. see logs in logs/mycat.log
4.3.9
注意报错:
Caused by: io.mycat.config.util.ConfigException: Illegal table conf : table [ MYCAT_STUDENT ] rule function [ mod-long ] partition size : 3 > table datanode size : 2, please make sure table datanode size = function partition
这个问题是因为rule.xml 中节点数的的数目配置的不对
修改下这就可以了
<property name="count">2</property>
启动成功后可以直接使用数据库连接工具连接mycat
mycat的dbType配置的是什么数据库,就使用这一种数据库进行连接即可
mycat有两个端口号:
9066:管理端口号(管理mycat使用的)
8066:通讯端口号(连接端口号) 链接数据库就要使用这个8066端口号
读写分离和分库分表 是单独存在的,这里不可以配在一起
也可以自己配置读写分离与分库分表一起,但是不是这样配置的
5.读写分离
1.什么是读写分离:
在同一个系统(项目)中,把对数据库的读和写分别在集群的不同节点上完成,这种模式就称之为读写分离
2.读写分离的配置
server.xml
配置了mycat的用户以及schemas(相当于mysql的数据库)
rule.xml
配置了datanode的数量
指定了mycat的分片(dataHost)的规则
修改这个节点的数目
<property name="count">2</property>
schema.xml
真正的读写分离的配置
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<!--
读写分离
把读数据的操作在mysql03上实现(mysql03没有数据)
把写数据的操作在mysql04上实现(mysql04有数据)
也就是说整个读写分离的核心就是实现了mysql03和mysql04的数据同步
数据同步的核心就是实现mysql03和mysql04的主从复制
在之前讲的数据同步:
当实现增删改的时候需要重新把mysql全表扫描然后存入redis中
主从:
两台数据库的关系
mysql03是主库(只写数据)
主库向从库同步数据
mysql04是从库(只读数据)
每一个readHost不能单独存在,必须要配置在writeHost里面
-->
<schema name="TEACH" checkSQLschema="false" sqlMaxLimit="100">
<table name="mycat_teach" dataNode="dn1" rule="mod-long" />
</schema>
<!--
database:在读写分离的配置中非常重要
因为读写分离需要实现主从复制(在mysql的主从复制中必须非常准确的定位这个database的名字)
-->
<dataNode name="dn1" dataHost="localhost1" database="teach" />
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="3"
writeType="0" dbType="mysql" dbDriver="native" switchType="2" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<!-- can have multi write hosts -->
<!--
实现读写分离的配置:
mysql03作为写的数据库
mysql04作为读的数据库
-->
<writeHost host="hostM1" url="192.168.23.131:3306" user="root" 主数据库
password="root">
<readHost host="hostS1" url="192.168.23.132:3306" user="root" password="root" /> 从数据库
</writeHost>
<writeHost host="hostM1" url="192.168.23.133:3306" user="root"
password="root" />
</dataHost>
</mycat:schema>
3.在schema.xml中的dataHost标签里有三个非常重要属性
!!!mycat也是支持负载均衡的!!!
3.1.balance
0:不使用负载均衡
1:所有的writeHost的从节点都要参与负载(无论是读数据还是写数据),
但是writeHost的主节点只写数据,不读数据
writeHost-->有5个从节点(一般情况下,这5个写数据的从节点是不工作的,
当主节点宕机了以后从节点才会开始工作)
一旦把balance的值配置为1,说明所有的writeHost的从节点都必须要参与读和写的操作
(也就是说所有的从节点和主节点平等)
面试题:
writeHost的主节点是否参与读数据的操作?
不参与
mycat为什么这样设计?
必须要知道什么时候会配置1-->因为访问量过大导致主节点压力过大
当峰值访问量结束后-->需要回归最初的状态-->一台主节点和5台从节点
如果说在峰值访问的数据量非常大--->直接导致了主节点宕机-->
但是从节点完好-->峰值数据过去后-->主节点处于宕机状态-->
从节点无法找到主节点-->还是从节点(不工作的)
2:所有的主节点和从节点都要参与负载
(无论是writeHost的主节点还是从节点都必须实现读和写的操作)
3:所有的readHost无论是主节点还是从节点都必须参与负载,但是writeHost并不参与读的操作
readHost如果也需要配置主从(1主3从)
主节点工作,但是从节点一般情况下是不工作的,只有当主节点宕机的时候,
从节点才开始工作
所有readHost的主节点和从节点都开始工作(也就是说所有的节点都是平等的),
但是writeHost并不参与读的操作,也不参与负载!
3.2.writeType(写入的方式:一定要和主节点和从节点有关)
0:自动主从(在1.4以后支持了主从关系,但是并没有支持主从复制)
也就是mycat会自动分配主从,如果说在同一个dataHost标签中配置了多个writeHost,
则mycat会自动分配主从
1:所有写操作都随机的发送到配置的 writeHost(1.5版本之前生效)
1:不进行主从(1.5版本之后生效),随机
!!!!两个writeHost,mycat会随机只向一个writeHost中写数据,
就算该writeHost宕机,也不会向另一个writeHost写入数据(???为什么这么设置???)
!!并不是标准答案,只是我的个人理解:
那个从来不写数据的writeHost是后备节点,一般情况下和readHost配置的一样,
如果writeHost宕机,单独一台readHost是不能存在的,需要后备节点的支持!!!!
2:所有的writeHost节点不再执行写的操作,所有的writeHost都停止写操作,
只供查询的操作(查询压力比较大的时候才会使用到)
3.3.switchType(切换的方式)
无论是-1还是1都根据的是mycat所自带的主从关系
-1:不自动切换
writeHost配置的规则为一台主节点一台从节点
如果主节点宕机,从节点还是从节点,并不会自动切换为主节点
1:自动切换
根据的是mysql所配置主从关系
2:根据mysql配置主从进行切换(监视mysql的主从心跳)
Slave_IO_Runing(YES)
Slave_SQL_Running(YES)
3:和2一样,只是2为单节点,3为集群模式
4.实现mysql的主从复制
4.1.配置主节点
mysql03为主节点
4.1.1.配置my.cnf文件
以下所有的配置都必须在[mysqld]标签之下和[mysqld_safe]标签之上
配置主从复制的数据库名,要求和dataNode标签中的database属性值一模一样
binlog-do-db=teach
配置忽略mysql数据库的主从复制
也就是说mysql自带的mysql数据库并不参与主从复制(可以配也可以不配,但是要求配置)
binlog-ignore-db=mysql
开启二进制日志(可以配也可以不配,为了以后mysql出错做日志分析使用)
log-bin=mysql-bin
配置唯一标识符(id)(这个唯一标识不能和其他的任何mysql服务器一致,这个必须要保持唯一,一般情况下为了保证唯一性,配置的是该台服务器的ip最后一段(192.168.23.131))
server-id=131
4.1.2.重启mysql服务
service mysqld restart
4.1.3.进入到mysql中
在mysql的bin目录
./mysql -u root -p
4.1.4.执行命令
向其他的从节点进行授权
grant file on *.* to 'root'@'%' identified by 'root';
4.1.5.开启向从库复制数据
grant replication slave, replication client on *.* to 'root'@'%' identified by 'root';
4.1.6.也是授权命令(实现了最大程度的授权,向从节点开放超级管理员模式,包括主从复制)
推荐配置
grant all on *.* to 'root'@'%' identified by 'root' with grant option;
4.1.7.提交并刷新
flush privileges;
4.1.8.查看主节点状态
show master status;
4.2.从节点配置(非常简单)
4.2.1.配置my.cnf文件
以下所有的配置都必须在[mysqld]标签之下和[mysqld_safe]标签之上
在整个my.cnf中只需要配置server-id即可,其他的都不需要配
4.2.2.重启mysql服务
.
4.2.3.进入mysql中
在mysql的bin目录
./mysql -u root -p
4.2.4.认主
change master to master_host='192.168.23.131',master_port=3306,master_user='root',master_password='root',master_log_file='mysql-bin.000001',master_log_pos=1153;
所有的配置都必须使用,隔开,并且只有端口号和position不需要单引号,其他的都必须要单引号
master_host:主节点的ip地址
master_port:主节点的端口号
master_user:主节点的用户名
master_password:主节点的密码
master_log_file:主节点的日志文件--->在主节点使用show master status;查看(File)
master_log_pos:主节点的定位信息在主节点使用show master status;查看(Position)
4.2.5.刷新并提交
flush privileges;
4.2.6.开启主从复制
start slave;
4.2.7.查看从节点的状态
show slave status;
Slave_IO_Running=YES
Slave_SQL_Running=YES
说明配置成功