jjzjj

JUC篇:CopyOnWriteArrayList的应用与原理

Turbos01 2023-04-04 原文

系列文章目录

JUC篇:volatile可见性的实现原理
JUC篇:synchronized的应用和实现原理
JUC篇:用Java实现一个简单的线程池
JUC篇:java中的线程池
JUC篇:ThreadLocal的应用与原理
JUC篇:Java中的并发工具类


文章目录


前言

并发包中的并发List只有CopyOnWriteArrayList。CopyOnWriteArrayList是一个线程安全的ArrayList,对其进行的修改操作都是在底层的一个复制的数组(快照)上进行的,也就是使用了写时复制策略


一、介绍

CopyOnWriteArraylist的类图结构如图

在CopyOnWriteArrayList的类图中,每个CopyOnWriteArrayList对象里面有一个array数组对象用来存放具体元素,ReentrantLock独占锁对象用来保证同时只有一个线程对array进行修改

如果让我们自己做一个写时复制的线程安全的list我们会怎么做,有哪些点需要考虑?

  • 何时初始化list,初始化的list元素个数为多少,list是有限大小吗?
  • 如何保证线程安全,比如多个线程进行读写时如何保证是线程安全的?
  • 如何保证使用迭代器遍历list时的数据一致性?

二、主要方法源码剖析

2.1 初始化

首先看下无参构造函数,如下代码在内部创建了一个大小为0的Object数组作为array的初始值。

public CopyOnWriteArrayList() {
        setArray(new Object[0]);
    }

有参构造函数

//创建一个list,其内部元素是入参toCopyin的副本
public CopyOnWriteArrayList(E[] toCopyIn) {
        setArray(Arrays.copyOf(toCopyIn, toCopyIn.length, Object[].class));
    }


//入参为集合,将集合里面的元素复制到本list
public CopyOnWriteArrayList(Collection<? extends E> c) {
        Object[] elements;
        if (c.getClass() == CopyOnWriteArrayList.class)
            elements = ((CopyOnWriteArrayList<?>)c).getArray();
        else {
            elements = c.toArray();
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elements.getClass() != Object[].class)
                elements = Arrays.copyOf(elements, elements.length, Object[].class);
        }
        setArray(elements);
    }

2.2 添加元素

CopyOnWrit巳ArrayList中用来添加元素的函数有add(E e)、add(int index,E element)、addifAbsent(E e)和addAllAbsent(Collection<?extendsE> c)等,它们的原理类似,所以以add(E e)为例来讲解。

public boolean add(E e) {
		//获取独占锁(1)
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
        	//获取array(2)
            Object[] elements = getArray();
            //复制array到新数组,添加元素到新数纽(3)
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len + 1);
            newElements[len] = e;
            //使用新数纽替换添加前的数纽(4)
            setArray(newElements);
            return true;
        } finally {
        	//释放独占锁(5)
            lock.unlock();
        }
    }

在如上代码中,调用add方法的线程会首先执行代码(1)去获取独占锁,如果多个线程都调用add方法则只有一个线程会获取到该锁,其他线程会被阻塞挂起直到锁被释放。

所以一个线程获取到锁后,就保证了在该线程添加元素的过程中其他线程不会对array进行修改。

线程获取锁后执行代码(2)获取array,然后执行代码(3)复制array到一个新数组(从这里可以知道新数组的大小是原来数组大小增加1,所以CopyOnWriteArrayList是无界list),并把新增的元素添加到新数组。

然后执行代码(4)使用新数组替换原数组,并在返回前释放锁。由于加了锁,所以整个add过程是个原子性操作。需要注意的是,在添加元素时,首先复制了一个快照,然后在快照上进行添加,而不是直接在原来数组上进行。

2.3 获取指定位置元素

使用E get(int index)获取下标为index的元素,如果元素不存在则抛出IndexOutOfBoundsException异常。

public E get(int index) {
        return get(getArray(), index);
    }

final Object[] getArray() {
        return array;
    }

private E get(Object[] a, int index) {
        return (E) a[index];
    }

在如上代码中,当线程x调用get方法获取指定位置的元素时,分两步走,首先获取array数组(这里命名为步骤A),然后通过下标访问指定位置的元素(这里命名为步骤B),这是两步操作,但是在整个过程中并没有进行加锁同步。假设这时候List内容如图所示,
里面有1、2、3三个元素。

由于执行步骤A和步骤B没有加锁,这就可能导致在线程x执行完步骤A后执行步骤B前,另外一个线程y进行了remove操作,假设要删除元素1。remove操作首先会获取独占锁,然后进行写时复制操作,也就是复制一份当前array数组,然后在复制的数组里面删除线程x通过get方法要访问的元素1,之后让array指向复制的数组。而这时候array之前指向的数组的引用计数为1而不是0,因为线程x还在使用它,这时线程x开始执行步骤B,步骤B操作的数组是线程y删除元素之前的数组,如图

所以,虽然线程y己经删除了index处的元素,但是线程x的步骤B还是会返回index处的元素,这其实就是写时复制策略产生的弱一致性问题。

2.4 弱一致性的迭代器

遍历列表元素可以使用法代器。在讲解什么是法代器的弱一致性前,先举一个例子来·说明如何使用法代器。

public static void main(String[] args) {
        CopyOnWriteArrayList<String> arrayList = new CopyOnWriteArrayList<>();
        arrayList.add("hello");
        arrayList.add("hi");

        Iterator<String> iterator = arrayList.iterator();
        while (iterator.hasNext()){
            System.out.println(iterator.next());
        }
    }

输出如下

迭代器的hasNext方法用于判断列表中是否还有元素,next方法则具体返回元素,好了,下面来看CopyOnWriteArrayList中法代器的弱一致性是怎么回事,所谓弱一致性是指返回迭代器后,其他线程对list的增删改对迭代器是不可见的,下面看看这是如何做到的。

public Iterator<E> iterator() {
        return new COWIterator<E>(getArray(), 0);
    }

 static final class COWIterator<E> implements ListIterator<E> {
     //array的快照版本
      private final Object[] snapshot;
     //	数组下标
      private int cursor;
     
     private COWIterator(Object[] elements, int initialCursor) {
            cursor = initialCursor;
            snapshot = elements;
        }
		//是否遍历结束
        public boolean hasNext() {
            return cursor < snapshot.length;
        }
		//获取元素
      public E next() {
            if (! hasNext())
                throw new NoSuchElementException();
            return (E) snapshot[cursor++];
        }
 }

如上代码中,当调用iterator()方法获取法代器时实际上会返回一个COWiterator对象,COWiterator对象的snapshot变量保存了当前list的内容,cursor是遍历list时数据的下标。

为什么说snapshot是list的快照呢?明明是指针传递的引用啊,而不是副本。

如果在该线程使用返回的法代器遍历元素的过程中,其他线程没有对list进行增删改,那么snapshot本身就是list的array,因为它们是引用关系。但是如果在遍历期间其他线程对该list进行了增删改,那么snapshot就是快照了,因为增删改后list里面的数组被新数组替换了,
这时候老数组被snapshot引用。这也说明获取迭代器后,使用该法代器元素时,其他线程对该list进行的增删改不可见,因为它们操作的是两个不同的数组,这就是弱一致性。

下面通过一个例子来演示多线程下法代器的弱一致性的效果。

//测试CopyOnWriteArrayList的迭代器的弱一致性
public class CopyOnWriteArrayListTest {

    public static void main(String[] args) throws InterruptedException {
        CopyOnWriteArrayList<String> arrayList = new CopyOnWriteArrayList<>();
        arrayList.add("hello");
        arrayList.add("hi");
        arrayList.add("welcome");
        arrayList.add("turbos");
        arrayList.add("tube");

        Thread thread = new Thread(new Runnable() {
            @Override
            public void run() {
                arrayList.set(0,"hello world!");
                arrayList.remove(2);
                arrayList.remove(3);
            }
        });

        //线程启动前,先获取迭代器
        Iterator<String> iterator = arrayList.iterator();
        
        //线程启动并保证主线程在子线程之后执行
        thread.start();
        thread.join();
        while (iterator.hasNext()){
            System.out.println(iterator.next());
        }
    }
}

输出结果

如上代码中,main函数首先初始化了arrayList,然后在启动线程前获取到了arrayList迭代器。子线程thread启动后首先修改了arrayList的第一个元素的值,然后删除了arrayList中下标为2和3的元素。
主线程在子线程执行完毕后使用获取的迭代器遍历数组元素,从输出结果我们知道,在子线程里面进行的操作一个都没有生效,这就是选代器弱一致性的体现。
需要注意的是,获取迭代器的操作必须在子线程操作之前进行。


总结

CopyOnWriteArrayList使用写时复制的策略来保证list的一致性,而获取一修改一写入三步操作并不是原子性的,所以在增删改的过程中都使用了独占锁,来保证在某个时间只有一个线程能对list数组进行修改。另外CopyOnWriteArrayList提供了弱一致性的迭代
器,从而保证在获取迭代器后,其他线程对list的修改是不可见的
,迭代器遍历的数组是一个快照。

有关JUC篇:CopyOnWriteArrayList的应用与原理的更多相关文章

  1. ruby - 将差异补丁应用于字符串/文件 - 2

    对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl

  2. ruby-on-rails - Rails 应用程序之间的通信 - 2

    我构建了两个需要相互通信和发送文件的Rails应用程序。例如,一个Rails应用程序会发送请求以查看其他应用程序数据库中的表。然后另一个应用程序将呈现该表的json并将其发回。我还希望一个应用程序将存储在其公共(public)目录中的文本文件发送到另一个应用程序的公共(public)目录。我从来没有做过这样的事情,所以我什至不知道从哪里开始。任何帮助,将不胜感激。谢谢! 最佳答案 无论Rails是什么,几乎所有Web应用程序都有您的要求,大多数现代Web应用程序都需要相互通信。但是有一个小小的理解需要你坚持下去,网站不应直接访问彼此

  3. ruby - 无法运行 Rails 2.x 应用程序 - 2

    我尝试运行2.x应用程序。我使用rvm并为此应用程序设置其他版本的ruby​​:$rvmuseree-1.8.7-head我尝试运行服务器,然后出现很多错误:$script/serverNOTE:Gem.source_indexisdeprecated,useSpecification.Itwillberemovedonorafter2011-11-01.Gem.source_indexcalledfrom/Users/serg/rails_projects_terminal/work_proj/spohelp/config/../vendor/rails/railties/lib/r

  4. ruby-on-rails - Rails 应用程序中的 Rails : How are you using application_controller. rb 是新手吗? - 2

    刚入门rails,开始慢慢理解。有人可以解释或给我一些关于在application_controller中编码的好处或时间和原因的想法吗?有哪些用例。您如何为Rails应用程序使用应用程序Controller?我不想在那里放太多代码,因为据我了解,每个请求都会调用此Controller。这是真的? 最佳答案 ApplicationController实际上是您应用程序中的每个其他Controller都将从中继承的类(尽管这不是强制性的)。我同意不要用太多代码弄乱它并保持干净整洁的态度,尽管在某些情况下ApplicationContr

  5. ruby-on-rails - 如何在我的 Rails 应用程序 View 中打印 ruby​​ 变量的内容? - 2

    我是一个Rails初学者,但我想从我的RailsView(html.haml文件)中查看Ruby变量的内容。我试图在ruby​​中打印出变量(认为它会在终端中出现),但没有得到任何结果。有什么建议吗?我知道Rails调试器,但更喜欢使用inspect来打印我的变量。 最佳答案 您可以在View中使用puts方法将信息输出到服务器控制台。您应该能够在View中的任何位置使用Haml执行以下操作:-puts@my_variable.inspect 关于ruby-on-rails-如何在我的R

  6. ruby-on-rails - 如何在 Gem 中获取 Rails 应用程序的根目录 - 2

    是否可以在应用程序中包含的gem代码中知道应用程序的Rails文件系统根目录?这是gem来源的示例:moduleMyGemdefself.included(base)putsRails.root#returnnilendendActionController::Base.send:include,MyGem谢谢,抱歉我的英语不好 最佳答案 我发现解决类似问题的解决方案是使用railtie初始化程序包含我的模块。所以,在你的/lib/mygem/railtie.rbmoduleMyGemclassRailtie使用此代码,您的模块将在

  7. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  8. 叮咚买菜基于 Apache Doris 统一 OLAP 引擎的应用实践 - 2

    导读:随着叮咚买菜业务的发展,不同的业务场景对数据分析提出了不同的需求,他们希望引入一款实时OLAP数据库,构建一个灵活的多维实时查询和分析的平台,统一数据的接入和查询方案,解决各业务线对数据高效实时查询和精细化运营的需求。经过调研选型,最终引入ApacheDoris作为最终的OLAP分析引擎,Doris作为核心的OLAP引擎支持复杂地分析操作、提供多维的数据视图,在叮咚买菜数十个业务场景中广泛应用。作者|叮咚买菜资深数据工程师韩青叮咚买菜创立于2017年5月,是一家专注美好食物的创业公司。叮咚买菜专注吃的事业,为满足更多人“想吃什么”而努力,通过美好食材的供应、美好滋味的开发以及美食品牌的孵

  9. 【鸿蒙应用开发系列】- 获取系统设备信息以及版本API兼容调用方式 - 2

    在应用开发中,有时候我们需要获取系统的设备信息,用于数据上报和行为分析。那在鸿蒙系统中,我们应该怎么去获取设备的系统信息呢,比如说获取手机的系统版本号、手机的制造商、手机型号等数据。1、获取方式这里分为两种情况,一种是设备信息的获取,一种是系统信息的获取。1.1、获取设备信息获取设备信息,鸿蒙的SDK包为我们提供了DeviceInfo类,通过该类的一些静态方法,可以获取设备信息,DeviceInfo类的包路径为:ohos.system.DeviceInfo.具体的方法如下:ModifierandTypeMethodDescriptionstatic StringgetAbiList​()Obt

  10. ruby-on-rails - 从应用程序中自定义文件夹内的命名空间自动加载 - 2

    我们目前正在为ROR3.2开发自定义cms引擎。在这个过程中,我们希望成为我们的rails应用程序中的一等公民的几个类类型起源,这意味着它们应该驻留在应用程序的app文件夹下,它是插件。目前我们有以下类型:数据源数据类型查看我在app文件夹下创建了多个目录来保存这些:应用/数据源应用/数据类型应用/View更多类型将随之而来,我有点担心应用程序文件夹被这么多目录污染。因此,我想将它们移动到一个子目录/模块中,该子目录/模块包含cms定义的所有类型。所有类都应位于MyCms命名空间内,目录布局应如下所示:应用程序/my_cms/data_source应用程序/my_cms/data_ty

随机推荐