天天看点

JDBC PreparedStatement 批量查询 in 的实现 方案

    我们经常会有这种业务需求,根据一个条件集合去查询一张表的数据,比如:

select * from all_element

t where t.task_id in (list <taskids>);

    在java语言中,我们需要用到jdbc来和数据库打交道,那么在jdbc中该如何处理这种需求呢?我们可以有如下几种处理方式

方案一:写一个函数把参数集合转换成一个or 条件

或 in 条件的字符串,最后拼成一个sql

t where t.task_id in (123 ,456, 789);

或者是:

t where t.task_id=123 or t.task_id= 456 t.task_id= 789;

    但是这样效率如何呢?我们知道oracle对传过来的sql是需要事先编译的,不过是oracle有个缓存功能可以缓存编译好的sql,但前提是传过来的sql必须完全一致,很明显,如果按照以上方式的话,一旦taskid值变化,那么oracle的缓存便无法利用。

方案二:使用预编译的preparestatement

    为了解决oracle缓存无法利用问题,jdbc提供了预编译的preparestatement,对于变化的参数可以用占位符

<?> 来代替,因此我们可以用占位符来减少oracle编译次数。

        private static final string query = "select

* from all_element where taskid = ?";

          ps = con .preparestatement(query);

          for(string taskid : taskids){

             ps.setint(1, taskid);

             rs = ps .executequery();

          }

    这样做虽然可以很好的利用oracle的缓存,但缺点也很明显,就是每一个id都需要查询数据库一次,这样效率是极低的。

方案三:动态地创建preparestatement

    虽然变化的参数可以用占位符 <?> 来代替,然而遗憾的是jdbc只提供了单一占位符功能即占位符不能是一个可迭代的集合。因此,对于我们传过来的集合参数,我们可以动态地创建一个preparestatement:

    拼一个和集合大小相等数量占位符的sql,再写一个循环来赋值每一个占位符,这样就可以解决taskid的值变化而导致oracle重新编译sql问题。

    private static void createquery(list<string>

taskids) {

          string query = "select * from all_element t where t.task_id in (";

          stringbuilder querybuilder = new stringbuilder(query);

           for ( int i

= 0; i < taskids.size(); i++) {

              querybuilder.append( " ?");

               if (i != taskids.size() - 1)

                   querybuilder.append( ",");

          }

          querybuilder.append( ")");

           ps = con .preparestatement(query);

= 1; i <= taskids.size(); i++) {

               ps.setint(i, taskids.get(i - 1));

           rs = ps .executequery();

     }

    但是这么做还是存在一个问题,如果集合的值变化不会导致oracle重新编译,但是如果集合的大小发生变化,相对应的sql也就发生了变化,同样也会导致oracle重新编译,那么该如何解决这个问题呢?

方案四:批量查询(减少查询次数并利用到oracle缓存)

    批量查询兼顾了第二、第三种方案,其思想是预先定义好几个每次要查询参数的个数,然后把参数集合按这些定义好的值划分成小组。比如我们的前台传过来一个数量为75的taskid的集合,我预定义的批量查询参数的个数分别为:

    single_batch = 1;//注意:为了把参数集合完整划分,这个值为1的批量数是必须的

    small_batch = 4;

    medium_batch = 11;

    large_batch = 51;

    那么我们第一次会查询51条数据,还剩下24个没有查询,那么第二次批量查询11条数据,还剩下13条未查询,第三次再批量查询11条数据,最后还剩2条未查询,那么我们再分两批次,每批次仅查询一条,这样,最终一个75条的数据分5批次即可查询完成,减少了查询次数,而且还利用到了数据库缓存。附获取批量的算法:

     public static final int single_batch =

1; //注意:为了把参数集合完整划分,这个值为1的批量数是必须的

      public static final int small_batch =

4;

      public static final int medium_batch =

11;

      public static final int large_batch =

51;

      static int totalnumberofvalueslefttobatch=75;

      public static list<integer> 

getbatchsize( int totalnumberofvalueslefttobatch){

          list<integer> batches= new arraylist<integer>();

           while ( totalnumberofvalueslefttobatch > 0 ) {

               int batchsize = single_batch;

               if ( totalnumberofvalueslefttobatch >= large_batch )

{

                batchsize = large_batch;

              } else if (

totalnumberofvalueslefttobatch >= medium_batch ) {

                batchsize = medium_batch;

totalnumberofvalueslefttobatch >= small_batch ) {

                batchsize = small_batch;

              }

              batches.add(batchsize);

              totalnumberofvalueslefttobatch -= batchsize;

              system. out.println(batchsize);

           return batches;