天天看点

MySQL关联查询优化实例

项目中发现有一个查询响应非常慢,花时间分析以及优化,特地记录。

(1)背景

项目采用MySQL数据库,操作使用Ibatis;

(2)查询说明

这个查询是每次查询一定数目的用户信息,查询中涉及到多表关联,具体查询SQL如下

<select id="select"  parameterClass="UserCompany" resultClass="UserCompany"> 
                SELECT S.NAME as name,
                	S.IMAGE as image,
                	S.ID as id,
                	C.NAME as companyName,
                	C.ID as companyId,
                	A.FILE_NAME AS resourceFileName,
                	A.FILE_PATH AS resourceFilePath,
                	A.FILE_ID AS resourceFileId,
                	COUNT(R.CONTACT) AS updResourceSize  
                	from sys_user_info S 
                	LEFT JOIN ATTACH_FILE_INFO A ON S.ID = A.USER_ID
			LEFT JOIN 
				(SELECT RESOURCE_ID,CONTACT FROM company_resource_info 
				WHERE UPDTIME >= #UPDResourceTime:TIMESTAMP# ) R 
			ON  S.ID = R.CONTACT,
                	company_info C 
                	WHERE S.COMPANY_ID = C.ID
                	GROUP BY S.ID
			LIMIT 15
	</select>           

注意其中用到了子查询,涉及到临时表

(3)分析过程

使用MySQL自带的profiler分析结果如下图

MySQL关联查询优化实例

观察可得,99%的时间花在了拷贝数据到临时表上,也就是与其中的子查询有关系。

想来奇怪,如果只是LIMIT 15条数据,临时数据不应该花费这么多时间;个人觉得问题应该出在LIMIT对于里面的子查询无效,也就是里面的子查询会涉及到全部数据,从而导致临时表消耗很大的时间,这样就不难理解了。

(4)优化

想清楚了上面的原因,解决的思路也就比较清楚了,只要让里面涉及的子查询只查LIMIT对应的数据就可以了。

重新实行的方式如下:

<resultMap class="cn.com.steel.wuyou.model.UserCompany" id="UserCompanyMap">
		<result property="name" column="name" />
		<result property="image" column="image" />
		<result property="id" column="id" />
		<result property="companyName" column="companyName" />
		<result property="companyId" column="companyId" />
		<result property="resourceFileName" column="resourceFileName" />
		<result property="resourceFilePath" column="resourceFilePath" />
		<result property="resourceFileId" column="resourceFileId" />
		<result property="UPDResourceTime" column="UPDResourceTime" />
		<result property="updResourceSize" column="{CONTACT=id,udpResourceTime=UPDResourceTime}"
			select="steel_userCompany.selectUpdResourceSize" />
	</resultMap>

	<select id="selectUpdResourceSize" parameterClass="java.util.HashMap"
		resultClass="int">
		SELECT COUNT(1) FROM company_resource_info
		WHERE CONTACT = #CONTACT#
		and UPDTIME >= #UPDResourceTime:TIMESTAMP#
	</select>


	<select id="select" parameterClass="UserCompany" resultMap="UserCompanyMap">
		SELECT S.NAME as name,
		S.IMAGE as image,
		S.ID as id,
		C.NAME as companyName,
		C.ID as companyId,
		A.FILE_NAME AS resourceFileName,
		A.FILE_PATH AS resourceFilePath,
		A.FILE_ID AS resourceFileId,
		#UPDResourceTime:TIMESTAMP# as UPDResourceTime
		from sys_user_info S
		LEFT JOIN ATTACH_FILE_INFO A ON S.ID = A.USER_ID
		LEFT JOIN company_info C ON S.COMPANY_ID = C.ID
		LIMIT 15
	</select>
           

主要的做法就是,每次先查出LIMIT 15条不含子查询结果的数据,定义一个resultMap映射结果集,针对每一条记录再去分别调用一次查询从而得到最后想要的结果。