LinkedList源码理解-开源中国

LinkedList是也是非常常见的集合类，LinkedList是基于链表实现的集合。它拥有List集合的特点：

存取有序
带索引
允许重复元素

还拥有Deque集合的特点：

先入先出
双端操作

它本身的特点是：

对元素进行插入或者删除，只需要更改一些数据，不需要元素进行移动。

依然是通过源码来看看LinkedList如何实现自己的特性的。

Doubly-linked list implementation of the {@code List} and {@code Deque} interfaces. Implements all optional list operations,and permits all elements (including {@code null}).

对于List接口和Deque接口的双链表实现。实现了所有List接口的操作并且能存储所有的元素。

public class LinkedList extends AbstractSequentialList 
                       implements List, Deque, Cloneable, java.io.Serializable

可以看到LinkedList实现了一个Deque接口，其实是说，LinkedList除了有List的特性，还有Deque的特性，那么Deque是什么呢？

public interface Deque extends Queue

        public interface Queue extends Collection

原来是继承了Collection集合的另一个接口。

Queue就是我们常说的队列，它的特性是FIFO( First In First Out )先进先出，它的操作只有两个：

把元素存进队列尾部
从头部取出元素

就像排队办事一样的。

而它的子接口Deque除了这两操作以外，还能比Queue队列有更多的功能

既可以添加元素到队尾，也可以添加元素到队头
既可以从队尾取元素，也可以从队头取元素

如此看来就像两边都可以当队头和队尾一样，所以Deque又叫双端队列。

理所应当的，LinkedLisk也实现了这些特性，并且有Doubly-linked(双链表的特性)。

那么什么又是链表呢？

其实链表是一种线性的存储结构，意思是将要存储的数据存在一个存储单元里面，这个存储单元里面除了存放有待存储的数据以外，还存储有其下一个存储单元的地址。

双链表顾名思义，存储单元除了存储其下一个存储单元的地址，还存储了上一个存储单元的地址。每次查找数据的时候，就通过存储单元里存储的地址信息进行查找。

成员变量：

transient int size = 0;

transient Node first;

transient Node last;

只有三个，size代表LinkedList存储的元素个数。那这个Node是什么？

    private static class Node {
        E item;
        Node next;
        Node prev;

        Node(Node prev, E element, Node next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

它是LinkedList内部的数据结构Node，作为LinkedList的基本存储单元，也最能体现LinkedList双链表的特性。

像这样的。

其中prev存储上一个节点的引用(地址)，next存储下一个单元的引用，item就是具体要存的数据。

First和Last用来标明队头跟队尾。

添加数据：

public boolean add(E e) {
        linkLast(e);
        return true;
    }

    
void linkLast(E e) {
        final Node l = last;
        final Node newNode = new Node(l, e, null);
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }

默认是调用添加到尾部的方法。前面说过，LinkedList的基本存储单元是Node，所以添加进来的数据会被封装进Node的item属性里，而且这个新Node的prev会指向前一个Node，前一个Node的next会指向这个新Node。

类似这样，但是注意画线只是一种形象的表达方法，就如上面所说，在Node里的prev属性和next属性是用来存储引用的，通过这个引用就能找到前一个Node或者后一个Node。

public void addFirst(E e) {
        linkFirst(e);
    }

private void linkFirst(E e) {
        final Node f = first;
        final Node newNode = new Node(null, e, f);
        first = newNode;
        if (f == null)
            last = newNode;
        else
            f.prev = newNode;
        size++;
        modCount++;
    }

public void addLast(E e) {
        linkLast(e);
    }

public boolean offerLast(E e) {
        addLast(e);
        return true;
    }

其实LinkedList很多不同名的方法，但是实现方式都是类似的，这是因为我们有可能用LinkedList表达不同的数据结构，虽然都是添加元素到队首/队尾，但是清晰的描述对代码的可读性是有好处的。像如果要用LinkedList表示Stack(栈)数据结构时候用push()/pop()/peek()等方法来描述，用LinkedList表示Queue(队列)数据结构时候用add()/offer()等方法来描述。(当然，更好的实现方式是多态。)

删除数据：

//删除头Node
public E removeFirst() {
        final Node f = first;
        if (f == null)
            throw new NoSuchElementException();
        return unlinkFirst(f);
    }

//删除操作
private E unlinkFirst(Node f) {
        // assert f == first && f != null;
        final E element = f.item;
        final Node next = f.next;
        f.item = null;
        f.next = null; // help GC
        first = next;
        if (next == null)
            last = null;
        else
            next.prev = null;
        size--;
        modCount++;
        return element;
    }
//删除尾Node
public E removeLast() {
        final Node l = last;
        if (l == null)
            throw new NoSuchElementException();
        return unlinkLast(l);
    }

//删除操作
    private E unlinkLast(Node l) {
        // assert l == last && l != null;
        //拿到最后一个元素存放的数据
        final E element = l.item;
        //拿到最后一个元素的prev前元素的引用
        final Node prev = l.prev;
        //将它们赋值为null
        l.item = null;
        l.prev = null; // help GC
        //现在前元素是list(最后一个Node)
        last = prev;
        //如果前元素已经是null说明没有Node了
        if (prev == null)
            first = null;
        else
            //说明前面还有元素，那么前元素的next就存放null
            prev.next = null;
        size--;
        modCount++;
        return element;
    }

先看看简单的删除，这里是指定删除最前跟最后的元素，所以只要判断删除后Node的prev或者next是否还有值，有就说明还有Node，没有就说明LinkedList已经为空了。

怎样才算删除了头/尾Node，只要它的next/prev为空，说明没有引用指向它了，那么我们就认为它从LinkedList里删除了，因为我们无法通过存储单元的引用找到这个Node，所以GC很快也会来回收掉这个Node。

这只是删除头尾Node，那要是删除中间的Node呢？这要跟下面的查找和插入一起看。

查找元素：

public E get(int index) {
        checkElementIndex(index);
        return node(index).item;
    }


Node node(int index) {
        // assert isElementIndex(index);
        
        //如果索引小于元素个数的一半，就从前遍历
        if (index > 1)) {
            Node x = first;
            for (int i = 0; i  x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

数组默认是有下标的，可以一次就取出所在位置的元素，但是LinkedList底层可没有维护这么一个数组，那怎么知道第几个元素是什么呢？

笨方法，我有size个元素，我不知道你指定的index在哪，那我一个一个找过去不就完事了？毕竟我的存储单元Node记得它旁边的单元的引用(地址)。

如果你的index比我size的一半还大，那我就从后面找，因为我是双端队列，有Last的引用(地址)，所以可以调换两头。

所以，在LinkedList里面找元素可不容易，最多可能要找size/2次才能找到。

只要找到了想要的位置，那么插入和删除指定的这个Node就很简单了。

public E remove(int index) {
        checkElementIndex(index);
        return unlink(node(index));
    }

E unlink(Node x) {
        // assert x != null;
    //拿到所要删除的Node的item
        final E element = x.item;
    //后一个Node
        final Node next = x.next;
    //前一个Node
        final Node prev = x.prev;

    //如果前一个Node为null(说明是第一个Node)
        if (prev == null) {
            //那么后一个Node作为first
            first = next;
        } else {//否则说明前面有Node
            //那前一个Node的下一个Node引用变为后一个Node
            prev.next = next;
            //当前的前引用变成null
            x.prev = null;
        }

    //如果后一个Node为null(说明是最后一个Node)
        if (next == null) {
            //那么前一个Node作为last
            last = prev;
        } else {//否则说明后面还有Node
            //那后一个Node的下一个Node引用变为前一个Node
            next.prev = prev;
            //当前的后引用变为null
            x.next = null;
        }

    //保存的元素也设为null
        x.item = null;
    //元素-1
        size--;
    //修改次数+1
        modCount++;
        return element;
    }

    public void add(int index, E element) {
        checkPositionIndex(index);

        if (index == size)
            linkLast(element);
        else
            linkBefore(element, node(index));
    }

    void linkBefore(E e, Node succ) {
        // assert succ != null;
        //要插入位置的前一个Node
        final Node pred = succ.prev;
        //新Node，前引用是前一个Node，后引用是当前位置的Node
        final Node newNode = new Node(pred, e, succ);
        //后一个Node的前引用变为这个新Node
        succ.prev = newNode;
        //如果没有前一个Node
        if (pred == null)
            //说明添加的就是第一个Node了
            first = newNode;
        else//说明前面还有Node
            //将前一个Node的后引用变为这个新的Node
            pred.next = newNode;
        //元素+1
        size++;
        modCount++;
    }

只是改变了存储单元Node里的prev和next，我们就可以认为这个Node被插入/删除了。

代码的注释配合着下图看，就会方便理解很多，其中注意区分源代码中的命名，最好拿笔记一下容易区分一些。

如果是插入元素，倒着看就可以了。

关于遍历：

我们可以了解到，LinkedList最大的性能消耗就在node(index)这步，这会需要去查找大量的元素。但是只要找到了这个元素所在的Node，插入跟删除就非常的方便了。

所以对于get(index)这个方法，我们需要非常小心的去使用，如果只想看一看这个位置的元素，可以用这个方法，但是如果是遍历LinkedList，千万不可以这样写：

for (int i = 0; i

这样对于每次循环,get总会从前或者从后走i次，不考虑get方法中>>1的优化的话，这是一种O(n^2)时间复杂度的做法，效率十分低下。

所以LinkedList提供了内部的Iterator迭代器供我们使用：

private class ListItr implements ListIterator {
        private Node lastReturned;
        private Node next;
        private int nextIndex;
        private int expectedModCount = modCount;

        ListItr(int index) {
            // assert isPositionIndex(index);
            next = (index == size) ? null : node(index);
            nextIndex = index;
        }

        public boolean hasNext() {
            return nextIndex

其实就是通过不断调用next()方法取得Node，然后再对Node做操作，这样时间复杂度就是O(n)了，不会有大量重复无用的遍历。

总结：其实LinkedList的特点插入、删除快，只是针对这次的操作而言的。

LinkedList做插入、删除的时候，慢在要找到具体的位置，快在只需要改变前后Node的引用地址

ArrayList做插入、删除的时候，慢在数组元素的批量赋值(前文里的System.arraycopy)，快在搜索

所以，如果待插入、删除的元素是在数据结构的前半段尤其是非常靠前的位置的时候，LinkedList的效率将大大快过ArrayList，因为ArrayList将批量copy大量的元素；越往后，对于LinkedList来说，因为它是双向链表，所以在第2个元素后面插入一个数据和在倒数第2个元素后面插入一个元素在效率上基本没有差别，但是ArrayList由于要批量copy的元素越来越少，操作速度必然追上乃至超过LinkedList。

不论怎么说，需要根据具体情况来选择对应的集合，最好做一下性能测试，这样才能有更高的效率。

LinkedList源码理解

参与评论

评论留言

还没有评论留言，赶紧来抢楼吧~~

给这篇文章打个标签吧~