天天看点

mycat的schema.xml

'一、一个简单的schema.xml文件:

1、文件内容:

<?xml version="1.0"?>  

<!DOCTYPE mycat:schema SYSTEM "schema.dtd">  

<mycat:schema xmlns:mycat="http://io.mycat/">

    <!-- 设置表的存储方式.schema name="TESTDB" 与 server.xml中的 TESTDB 设置一致  -->  

    <schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100">  

        <table name="company" primaryKey="id" type="global" dataNode="node_db01" />  

        <table name="t_user" primaryKey="id" dataNode="node_db01,node_db02,node_db03" rule="mod-long"/>  

    </schema>  

    <!-- 设置dataNode 对应的数据库,及 mycat 连接的地址dataHost -->  

    <dataNode name="node_db01" dataHost="dataHost01" database="db1" />  

    <dataNode name="node_db02" dataHost="dataHost01" database="db2" />  

    <dataNode name="node_db03" dataHost="dataHost01" database="db3" />  

    <!-- mycat 逻辑主机dataHost对应的物理主机.其中也设置对应的mysql登陆信息 -->  

    <dataHost name="dataHost01" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native">  

            <heartbeat>select user()</heartbeat>  

            <writeHost host="hostM1" url="192.168.56.101:3306" user="root" password="123456"/>  

    </dataHost>  

</mycat:schema> 

2、说明:

(2.1)、<schema name="mycat" checkSQLschema="false" sqlMaxLimit="100">

在这一行参数里面,schema name定义了可以在MyCAT前端显示的逻辑数据库的名字,

checkSQLschema这个参数为False的时候,表明MyCAT会自动忽略掉表名前的数据库名,比如说mydatabase1.test1,会被当做test1;

sqlMaxLimit指定了SQL语句返回的行数限制;如果sql语句中出现limit会覆盖此处的sqlMaxLimit。

(2.2)、<table name="company" primaryKey="id" type="global" dataNode="node_db01" />

global表示 compay表是全局表 在节点node_db01对应的数据库中

(2.3)、<table name="t_user" primaryKey="id" dataNode="node_db01,node_db02,node_db03" rule="mod-long">  

(2.4)、mod-long 在rule.xml中:

<tableRule name="mod-long">

    <rule>

        <columns>id</columns>

        <algorithm>mod-long</algorithm>

    </rule>

</tableRule>

<function name="mod-long" class="io.mycat.route.function.PartitionByMod">

    <!-- how many data nodes -->

    <property name="count">3</property>

</function>

count值为数据库的节点数

如有三个数据库db1,db2,db3

dataHost 只写了一个表明 物理数据库只有一个,有三个不同逻辑库

(2.5)、balance 是否启用读写分离:

   balance=0时,读操作都在localhost上(localhost失败时,后端直接失败)。

  balance=1时,读操作会随机分散在localhost1和两个readhost上面(localhost失败时,写操作会在localhost1,如果localhost1再失败,则无法进行写操作)。

  balance=2时,写操作会在localhost上,读操作会随机分散在localhost1,localhost1和两个readhost上面(同上)

  我们这里只有个数据库服务器hostM1,故balance=0。

(2.6)、writeType 写操作只写入几个节点:

writeType=0时,写操作只会在localhost上,如果localhost失败,会自动切换到localhost1,localhost恢复以后并不会切换回localhost进行写操作。

writeType=1时,写操作会随机分布在localhost和localhost1上,单点失败并不会影响集群的写操作,但是后端的从库会无法从挂掉的主库获取更新,会在读数据的时候出现数据不一致

我们这里只有个数据库服务器hostM1,故balance=0。

(2.7)、switchType="-1,1,2,3"  是否启用主从切换:

-1:表示不启用主从切换;

1:为默认值,自动切换;

2:基于主从同步的状态,决定是否切换,与show slave status心跳对应;

3:基于多主galary集群切换,与show status like 'wsrep%'心跳对应;

备注:switchType=1、2、3时,需要配置多个writeHost节点。

(2.8)、heartbeat 心跳检测:switchType和heartbeat配合使用

<heartbeat>show slave status</heartbeat>  --心跳检测语句,一般为select user();

如果是switchType=2,基于主从同步状态决定是否切换,则心跳设为show slave status;

如果是switchType=3,则心跳设为show status like 'wsrep%';

二、一个稍微复杂的schema.xml文件:

<?xml version=\"1.0\"?>

<!DOCTYPE mycat:schema SYSTEM \"schema.dtd\">

<mycat:schema xmlns:mycat=\"http://org.opencloudb/\">

    <schema name="mycat" checkSQLschema="false" sqlMaxLimit="100">

        <!-- auto sharding by id (long) -->

        <table name="students" dataNode="dn1,dn2,dn3,dn4" rule="rule1" />

        <table name="log_test" dataNode="dn1,dn2,dn3,dn4" rule="rule2" />

        <!-- global table is auto cloned to all defined data nodes ,so can join 

            with any table whose sharding node is in the same data node -->

        <table name="item_test" primaryKey="ID" type="global" dataNode="dn1,dn2,dn3,dn4" />

     <table name="customer" primaryKey="ID" dataNode="dn1,dn2" rule="sharding-by-intfile">

        <childTable name="orders" primaryKey="ID" joinKey="customer_id" parentKey="id">

             <childTable name="order_items" joinKey="order_id" parentKey="id" />

        </childTable>

        <childTable name="customer_addr" primaryKey="ID" joinKey="customer_id" parentKey="id" />

      </table>

    </schema>

    <dataNode name=\"dn1\" dataHost=\"localhost\" database=\"test1\" />

    <dataNode name=\"dn2\" dataHost=\"localhost\" database=\"test2\" />

    <dataNode name=\"dn3\" dataHost=\"localhost\" database=\"test3\" />

    <dataNode name=\"dn4\" dataHost=\"localhost\" database=\"test4\" />

    <dataHost name="localhost" maxCon="100" minCon="10" balance="1"

        writeType="1" dbType="mysql" dbDriver="native">

        <heartbeat>select user()<beat>

        <!-- can have multi write hosts -->

        <writeHost host="localhost" url="localhost:3306" user="root" password="wangwenan">

            <!-- can have multi read hosts -->

            <readHost host=\"hostS1\" url="localhost:3307" user="root" password="wangwenan"/>

        </writeHost>

        <writeHost host="localhost1" url="localhost:3308" user="root" password="wangwenan">

            <readHost host="hostS11" url="localhost:3309" user="root" password="wangwenan"/>

    </dataHost>

</mycat:schema>

(2.1)、<table name="item_test" primaryKey="ID" type="global" dataNode="dn1,dn2,dn3,dn4" />

 这一行代表的是全局表,这意味着,item_test这张表会在四个dataNode里面都保存有完整的数据副本,那么查询的时候只会分发到某一个节点上

配置的primaryKey没发现作用在哪里,姑且忽略吧,以后发现了再补上.

(2.2)、childtable是一种依赖于父表的结构,这意味着,childtable的joinkey会按照父表的parentKey的策略一起切分,

当父表与子表进行连接,且连接条件是childtable.joinKey=parenttable.parentKey时,不会进行跨库的连接.

(2.3)、writeType和balance是用来控制后端集群的读写分离的关键参数,这里用了双主双从的集群配置。

      故writeType="1",balance="1"'''''

本文转自lzf0530377451CTO博客,原文链接:http://blog.51cto.com/8757576/2054740 ,如需转载请自行联系原作者