天天看点

Java集合框架:ArrayList

  ArrayList以数组实现,允许重复。超出限制时会增加50%的容量(grow()方法中实现,如下所示),每次扩容都底层采用System.arrayCopy()复制到新的数组,因此最好能给出数组大小的预估值。默认第一次插入元素时创建数组的大小为10.

  按数组下标访问元素—get(i)/set(i,e) 的性能很高,这是数组的基本优势。

  直接在数组末尾加入元素—add(e)的性能也高,但如果按下标插入、删除元素—add(i,e), remove(i), remove(e),则要用System.arraycopy()来移动部分受影响的元素,性能就变差了,这是基本劣势。

   ArrayList中有一个方法trimToSize()用来缩小elementData数组的大小,这样可以节约内存:

  考虑这样一种情形,当某个应用需要,一个ArrayList扩容到比如size=10000,之后经过一系列remove操作size=15,在后面的很长一段时间内这个ArrayList的size一直保持在<100以内,那么就造成了很大的空间浪费,这时候建议显式调用一下trimToSize()这个方法,以优化一下内存空间。

  或者在一个ArrayList中的容量已经固定,但是由于之前每次扩容都扩充50%,所以有一定的空间浪费,可以调用trimToSize()消除这些空间上的浪费。

  非线程安全,可以调用Collections.synchronizedList(new ArrayList<>());实现。

  举个简单一点的例子:

  运行结果:

  可以发现ArrayList是按插入顺序存储的,这也不奇怪,每次插入是在elementData[size++]处插入。

  调用ArrayList中的subList方法生成的新的list,内部引用的还是原来的数组elementData,如果改变subList中的值,主list中的值也会跟着改变。

  但是,上面的程序有不合理之处!你们可能感到费解,请听我一一道来。

  那么这又有什么不妥?集合框架印象中不就是用迭代器遍历的嚒?

  注意ArrayList的特殊之处在于它implements了RandomAccess这个接口,在JDK中RandomAccess明确说明:

  这段英文主要说明的是实现了RandomAccess接口的集合框架,采用迭代器遍历比较慢,不推荐。

  实现RandomAccess接口的集合有:ArrayList, AttributeList, CopyOnWriteArrayList, RoleList, RoleUnresolvedList, Stack, Vector等。

  所以上面的例子中的遍历应该这么写:

  其实也可以加个判断,让程序通用起来:

  因此,博主个人觉得JDK(jdk7)中有这么一段不妥之处(希望大神不要喷我):ArrayList的toString()方法是在AbstractCollection中实现的:

  这里没有判断RandomAccess,直接采用的是迭代器的遍历,影响了一些性能。

ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。

对于随机访问get和set,ArrayList觉得优于LinkedList,因为LinkedList要移动指针。

对于新增和删除操作add和remove,LinkedList比较占优势,因为ArrayList要移动数据。

Vector和ArrayList几乎是完全相同的,唯一的区别在于Vector是同步类(synchronized),属于强同步类。因此开销就比ArrayList要大,访问要慢。正常情况下,大多数的Java程序员使用ArrayList而不是Vector,因为同步完全可以由程序员自己来控制。

Vector每次扩容请求其大小的2倍空间,而ArrayList是1.5倍。

Vector还有一个子类Stack.

参考资料: