LinkedList是也是非常常见的集合类,LinkedList是基于链表实现的集合。它拥有List集合的特点:
- 存取有序
- 带索引
- 允许重复元素
还拥有Deque集合的特点:
- 先入先出
- 双端操作
它本身的特点是:
- 对元素进行插入或者删除,只需要更改一些数据,不需要元素进行移动。
依然是通过源码来看看LinkedList如何实现自己的特性的。
Doubly-linked list implementation of the {@code List} and {@code Deque} interfaces. Implements all optional list operations,and permits all elements (including {@code null}).
对于List接口和Deque接口的双链表实现。实现了所有List接口的操作并且能存储所有的元素。
public class LinkedList extends AbstractSequentialList
implements List, Deque, Cloneable, java.io.Serializable
可以看到LinkedList实现了一个Deque接口,其实是说,LinkedList除了有List的特性,还有Deque的特性,那么Deque是什么呢?
public interface Deque extends Queue
public interface Queue extends Collection
原来是继承了Collection集合的另一个接口。
Queue就是我们常说的队列,它的特性是FIFO( First In First Out )先进先出,它的操作只有两个:
- 把元素存进队列尾部
- 从头部取出元素
就像排队办事一样的。
而它的子接口Deque除了这两操作以外,还能比Queue队列有更多的功能
- 既可以添加元素到队尾,也可以添加元素到队头
- 既可以从队尾取元素,也可以从队头取元素
如此看来就像两边都可以当队头和队尾一样,所以Deque又叫双端队列 。
理所应当的,LinkedLisk也实现了这些特性,并且有Doubly-linked(双链表的特性)。
那么什么又是链表呢?
其实链表是一种线性的存储结构,意思是将要存储的数据存在一个存储单元里面,这个存储单元里面除了存放有待存储的数据以外,还存储有其下一个存储单元的地址。
双链表顾名思义,存储单元除了存储其下一个存储单元的地址,还存储了上一个存储单元的地址。每次查找数据的时候,就通过存储单元里存储的地址信息进行查找。
成员变量:
transient int size = 0;
transient Node first;
transient Node last;
只有三个,size代表LinkedList存储的元素个数。那这个Node是什么?
private static class Node {
E item;
Node next;
Node prev;
Node(Node prev, E element, Node next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
它是LinkedList内部的数据结构Node,作为LinkedList的基本存储单元,也最能体现LinkedList双链表的特性。
像这样的。
其中prev存储上一个节点的引用(地址),next存储下一个单元的引用,item就是具体要存的数据。
First和Last用来标明队头跟队尾。
添加数据:
public boolean add(E e) {
linkLast(e);
return true;
}
void linkLast(E e) {
final Node l = last;
final Node newNode = new Node(l, e, null);
last = newNode;
if (l == null)
first = newNode;
else
l.next = newNode;
size++;
modCount++;
}
默认是调用添加到尾部的方法。前面说过,LinkedList的基本存储单元是Node,所以添加进来的数据会被封装进Node的item属性里,而且这个新Node的prev会指向前一个Node,前一个Node的next会指向这个新Node。
类似这样,但是注意画线只是一种形象的表达方法,就如上面所说,在Node里的prev属性和next属性是用来存储引用的,通过这个引用就能找到前一个Node或者后一个Node。
public void addFirst(E e) {
linkFirst(e);
}
private void linkFirst(E e) {
final Node f = first;
final Node newNode = new Node(null, e, f);
first = newNode;
if (f == null)
last = newNode;
else
f.prev = newNode;
size++;
modCount++;
}
public void addLast(E e) {
linkLast(e);
}
public boolean offerLast(E e) {
addLast(e);
return true;
}
其实LinkedList很多不同名的方法,但是实现方式都是类似的,这是因为我们有可能用LinkedList表达不同的数据结构,虽然都是添加元素到队首/队尾,但是清晰的描述对代码的可读性是有好处的。像如果要用LinkedList表示Stack(栈)数据结构时候用push()/pop()/peek()等方法来描述,用LinkedList表示Queue(队列)数据结构时候用add()/offer()等方法来描述。(当然,更好的实现方式是多态。)
删除数据:
//删除头Node
public E removeFirst() {
final Node f = first;
if (f == null)
throw new NoSuchElementException();
return unlinkFirst(f);
}
//删除操作
private E unlinkFirst(Node f) {
// assert f == first && f != null;
final E element = f.item;
final Node next = f.next;
f.item = null;
f.next = null; // help GC
first = next;
if (next == null)
last = null;
else
next.prev = null;
size--;
modCount++;
return element;
}
//删除尾Node
public E removeLast() {
final Node l = last;
if (l == null)
throw new NoSuchElementException();
return unlinkLast(l);
}
//删除操作
private E unlinkLast(Node l) {
// assert l == last && l != null;
//拿到最后一个元素存放的数据
final E element = l.item;
//拿到最后一个元素的prev前元素的引用
final Node prev = l.prev;
//将它们赋值为null
l.item = null;
l.prev = null; // help GC
//现在前元素是list(最后一个Node)
last = prev;
//如果前元素已经是null说明没有Node了
if (prev == null)
first = null;
else
//说明前面还有元素,那么前元素的next就存放null
prev.next = null;
size--;
modCount++;
return element;
}
先看看简单的删除, 这里是指定删除最前跟最后的元素,所以只要判断删除后Node的prev或者next是否还有值,有就说明还有Node,没有就说明LinkedList已经为空了。
怎样才算删除了头/尾Node,只要它的next/prev为空,说明没有引用指向它了,那么我们就认为它从LinkedList里删除了,因为我们无法通过存储单元的引用找到这个Node,所以GC很快也会来回收掉这个Node。
这只是删除头尾Node,那要是删除中间的Node呢?这要跟下面的查找和插入一起看。
查找元素:
public E get(int index) {
checkElementIndex(index);
return node(index).item;
}
Node node(int index) {
// assert isElementIndex(index);
//如果索引小于元素个数的一半,就从前遍历
if (index > 1)) {
Node x = first;
for (int i = 0; i x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}
数组默认是有下标的,可以一次就取出所在位置的元素,但是LinkedList底层可没有维护这么一个数组,那怎么知道第几个元素是什么呢?
笨方法,我有size个元素,我不知道你指定的index在哪,那我一个一个找过去不就完事了?毕竟我的存储单元Node记得它旁边的单元的引用(地址)。
如果你的index比我size的一半还大,那我就从后面找,因为我是双端队列,有Last的引用(地址),所以可以调换两头。
所以,在LinkedList里面找元素可不容易,最多可能要找size/2次才能找到。
只要找到了想要的位置,那么插入和删除指定的这个Node就很简单了。
public E remove(int index) {
checkElementIndex(index);
return unlink(node(index));
}
E unlink(Node x) {
// assert x != null;
//拿到所要删除的Node的item
final E element = x.item;
//后一个Node
final Node next = x.next;
//前一个Node
final Node prev = x.prev;
//如果前一个Node为null(说明是第一个Node)
if (prev == null) {
//那么后一个Node作为first
first = next;
} else {//否则说明前面有Node
//那前一个Node的下一个Node引用变为后一个Node
prev.next = next;
//当前的前引用变成null
x.prev = null;
}
//如果后一个Node为null(说明是最后一个Node)
if (next == null) {
//那么前一个Node作为last
last = prev;
} else {//否则说明后面还有Node
//那后一个Node的下一个Node引用变为前一个Node
next.prev = prev;
//当前的后引用变为null
x.next = null;
}
//保存的元素也设为null
x.item = null;
//元素-1
size--;
//修改次数+1
modCount++;
return element;
}
public void add(int index, E element) {
checkPositionIndex(index);
if (index == size)
linkLast(element);
else
linkBefore(element, node(index));
}
void linkBefore(E e, Node succ) {
// assert succ != null;
//要插入位置的前一个Node
final Node pred = succ.prev;
//新Node,前引用是前一个Node,后引用是当前位置的Node
final Node newNode = new Node(pred, e, succ);
//后一个Node的前引用变为这个新Node
succ.prev = newNode;
//如果没有前一个Node
if (pred == null)
//说明添加的就是第一个Node了
first = newNode;
else//说明前面还有Node
//将前一个Node的后引用变为这个新的Node
pred.next = newNode;
//元素+1
size++;
modCount++;
}
只是改变了存储单元Node里的prev和next,我们就可以认为这个Node被插入/删除了。
代码的注释配合着下图看,就会方便理解很多,其中注意区分源代码中的命名,最好拿笔记一下容易区分一些。
如果是插入元素,倒着看就可以了。
关于遍历:
我们可以了解到,LinkedList最大的性能消耗就在node(index)这步,这会需要去查找大量的元素。但是只要找到了这个元素所在的Node,插入跟删除就非常的方便了。
所以对于get(index)这个方法,我们需要非常小心的去使用,如果只想看一看这个位置的元素,可以用这个方法,但是如果是遍历LinkedList,千万不可以这样写:
for (int i = 0; i
这样对于每次循环,get总会从前或者从后走i次,不考虑get方法中>>1的优化的话,这是一种O(n^2)时间复杂度的做法,效率十分低下。
所以LinkedList提供了内部的Iterator迭代器供我们使用:
private class ListItr implements ListIterator {
private Node lastReturned;
private Node next;
private int nextIndex;
private int expectedModCount = modCount;
ListItr(int index) {
// assert isPositionIndex(index);
next = (index == size) ? null : node(index);
nextIndex = index;
}
public boolean hasNext() {
return nextIndex
其实就是通过不断调用next()方法取得Node,然后再对Node做操作,这样时间复杂度就是O(n)了,不会有大量重复无用的遍历。
总结:其实LinkedList的特点插入、删除快,只是针对这次的操作而言的。
LinkedList做插入、删除的时候,慢在要找到具体的位置,快在只需要改变前后Node的引用地址
ArrayList做插入、删除的时候,慢在数组元素的批量赋值(前文里的System.arraycopy),快在搜索
所以,如果待插入、删除的元素是在数据结构的前半段尤其是非常靠前的位置的时候,LinkedList的效率将大大快过ArrayList,因为ArrayList将批量copy大量的元素;越往后,对于LinkedList来说,因为它是双向链表,所以在第2个元素后面插入一个数据和在倒数第2个元素后面插入一个元素在效率上基本没有差别,但是ArrayList由于要批量copy的元素越来越少,操作速度必然追上乃至超过LinkedList。
不论怎么说,需要根据具体情况来选择对应的集合,最好做一下性能测试,这样才能有更高的效率。