當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

学会了CopyOnWriteArrayList可以再多和面试官对线三分钟

發(fā)布時間：2025/3/15 编程问答 20 豆豆

生活随笔收集整理的這篇文章主要介紹了学会了CopyOnWriteArrayList可以再多和面试官对线三分钟小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

ArrayList是大家用的再熟悉不過的集合了，而此集合設(shè)計之初也是為了高效率，并未考慮多線程場景下，所以也就有了多線程下的CopyOnWriteArrayList這一集合

回憶下ArrayList

集合的fail-fast機制和fail-safe機制：

fail-fast快速失敗機制，一個線程A在用迭代器遍歷集合時，另個線程B這時對集合修改會導(dǎo)致A快速失敗，拋出ConcurrentModificationException?異常。在java.util中的集合類都是快速失敗的

fail-safe安全失敗機制，遍歷時不在原集合上，而是先復(fù)制一個集合，在拷貝的集合上進行遍歷。在java.util.concurrent包下的容器類是安全失敗的，建議在并發(fā)環(huán)境下使用這個包下的集合類?

ArrayList定義：

public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable { }

ArrayList簡介：

ArrayList是實現(xiàn)List接口的可變數(shù)組，并允許null在內(nèi)的重復(fù)元素

底層數(shù)組實現(xiàn)，擴容時將老數(shù)組元素拷貝到新數(shù)組中，每次擴容是其容量的1.5倍，操作代價高

采用了Fail-Fast機制，面對并發(fā)的修改時，迭代器很快就會完全失敗，而不是冒著在將來某個不確定時間發(fā)生任意不確定行為的風(fēng)險

ArrayList是線程不安全的，所以在單線程中才使用ArrayList，而在多線程中可以選擇Vector或者CopyOnWriteArrayList

重點關(guān)注問題：

?ArrayList默認(rèn)大小(為什么是這個？)，擴容機制？

ArrayList的默認(rèn)初始化大小是10（在新建的時候還是空，只有當(dāng)放入第一個元素的時候才會變成10），若知道ArrayList的大致容量，可以在初始化的時候指定大小，可以在適當(dāng)程度減少擴容的性能消耗（看下一個問題解析）。

至于為何是10

據(jù)說是因為sun的程序員對一系列廣泛使用的程序代碼進行了調(diào)研，結(jié)果就是10這個長度的數(shù)組是最常用的最有效率的。也有說就是隨便起的一個數(shù)字，8個12個都沒什么區(qū)別，只是因為10這個數(shù)組比較的圓滿而已。

ArrayList的擴容機制

當(dāng)添加元素的時候數(shù)組是空的，則直接給一個10長度的數(shù)組。當(dāng)需要長度的數(shù)組大于現(xiàn)在長度的數(shù)組的時候，通過新=舊+舊>>1(即新=1.5倍的舊)來擴容，當(dāng)擴容的大小還是不夠需要的長度的時候，則將數(shù)組大小直接置為需要的長度（這一點切記！）。

ArrayList特點訪問速度塊，為什么？插入刪除一定慢嗎？適合做隊列嗎？

ArrayList從結(jié)構(gòu)上來看屬于數(shù)組，也就是內(nèi)存中的一塊連續(xù)空間，當(dāng)我們get(index)時，可以直接根據(jù)數(shù)組的首地址和偏移量計算出我們想要元素的位置，我們可以直接訪問該地址的元素，所以查詢速度是O(1)級別的。

我們平時會說ArrayList插入刪除這種操作慢，查詢速度快，其實也不是絕對的。

當(dāng)數(shù)組很大時，插入刪除的位置決定速度的快慢，假設(shè)數(shù)組當(dāng)前大小是一千萬，我們在數(shù)組的index為0的位置插入或者刪除一個元素，需要移動后面所有的元素，消耗是很大的。但是如果在數(shù)組末端index操作，這樣只會移動少量元素，速度還是挺快的（插入時如果在加上數(shù)組擴容，會更消耗內(nèi)存）。

個人覺得不太適合做隊列，基于上面的分析，隊列會涉及到大量的增加和刪除（也就是移位操作），在ArrayList中效率還是不高。

ArrayList 底層實現(xiàn)就是數(shù)組，訪問速度本身就很快，為何還要實現(xiàn) RandomAccess ？

RandomAccess是一個空的接口, 空接口一般只是作為一個標(biāo)識, 如Serializable接口.。

JDK文檔說明RandomAccess是一個標(biāo)記接口(Marker interface), 被用于List接口的實現(xiàn)類, 表明這個實現(xiàn)類支持快速隨機訪問功能(如ArrayList). 當(dāng)程序在遍歷這中List的實現(xiàn)類時, 可以根據(jù)這個標(biāo)識來選擇更高效的遍歷方式。

?

優(yōu)缺點

上面說的查詢速度快自然就是其中的優(yōu)點，除此之外，還可以存儲相同的元素

底層數(shù)據(jù)結(jié)構(gòu)屬于數(shù)組，和數(shù)組的優(yōu)缺點大同小異，數(shù)組屬于線性表，更適合于那種在末尾經(jīng)常添加數(shù)據(jù)的場景，而對于在整個list中各個位置隨機添加元素比較多的情況則不太合適

因為可能會涉及到很多元素位置的移動

ArrayList還有一個比較大的缺點就是不適應(yīng)于多線程環(huán)境，這個設(shè)計之初也不是用于多線程環(huán)境的，像ArrayList、LinkedList、HashMap這種常見的都是以效率優(yōu)先的，都是沒有考慮線程安全的，也就自然不是線程安全的

而這，恰恰也就是本文的重點，也是面試官最愛的菜

ArrayList中的Fail-fast機制

fail-fast快速失敗機制，一個線程A在用迭代器遍歷集合時，此時另一個線程B如果對集合進行修改，就會導(dǎo)致線程A快速失敗，然后線程會拋出ConcurrentModificationException異常。

在java.util中的集合類都是快速失敗的，快速失敗機制就是應(yīng)對多線程場景的

Vector真的安全嗎

如何使用安全的ArrayList，很多人的答案可能是Vector，而Vector的實現(xiàn)其實也很簡單，我給大家看段代碼

是的，道理也很簡單，就是直接在每個方法加上synchronized關(guān)鍵字

public class CaptainTest {private static Vector<Integer> vector = new Vector();public static void main(String[] args) {while (true) {for (int i = 0; i < 10; i++) {vector.add(i); //往vector中添加元素}Thread removeThread = new Thread(new Runnable() {@Overridepublic void run() {for (int i = 0; i < vector.size(); i++) {Thread.yield();//移除第i個數(shù)據(jù)vector.remove(i);}}});Thread printThread = new Thread(new Runnable() {@Overridepublic void run() {for (int i = 0; i < vector.size(); i++) {Thread.yield();//獲取第i個數(shù)據(jù)并打印System.out.println(vector.get(i));}}});removeThread.start();printThread.start();//避免同時產(chǎn)生過多線程while (Thread.activeCount() > 20) ;}}}

我們來執(zhí)行上面的這段代碼，這段代碼會產(chǎn)生兩種線程，一種remove移除元素，一種是get獲取元素，但是都調(diào)用了size方法獲取大小

執(zhí)行之后會報一個越界的異常，這是為啥呢，Vector不是每個方法都加上了synchronized關(guān)鍵字了嗎，怎么會出現(xiàn)這種錯誤

加上關(guān)鍵字保證其它線程不能同時調(diào)用這些方法了，也就是，不能出現(xiàn)兩個及兩個以上的線程在同時調(diào)用這些同步方法

圖中報錯的問題的原因是：例子中的線程連續(xù)調(diào)用了兩個或者兩個以上的同步方法，聽起來很奇怪是嗎？我來解釋下

例子中的removeThread線程會首先調(diào)用size方法獲取大小，接著調(diào)用remove方法移除相應(yīng)位置的元素，而printThread線程也是先調(diào)用size方法獲取大小，接著調(diào)用get方法獲取相應(yīng)位置的元素

假設(shè)vector大小是5，此時printThread線程執(zhí)行到i=4的時候，進入for循環(huán)但是在執(zhí)行輸出之前，線程的CPU時間片到了，此時printThread則轉(zhuǎn)入到就緒狀態(tài)

此時removeThread線程獲得CPU的執(zhí)行權(quán)，然后把vector中的5個元素都刪除了，此時removeThread的CPU時間片到了

而此時printThread再獲取到CPU的執(zhí)行權(quán)，此時執(zhí)行輸出中的get(4)方法就會出現(xiàn)越界的錯誤，因為此時vector中的元素已經(jīng)被remove線程刪除了

synchronized關(guān)鍵字保證的是同一時間片只有一個線程進入該方法執(zhí)行，但是無法保證多個線程之間的數(shù)據(jù)同步，也就是remove線程刪除vector元素之后無法通知到print線程

聰明的你應(yīng)該已經(jīng)理解這個場景了吧，所以，vector在多線程使用的時候也不是絕對安全的

CopyOnWriteArrayList

這個就是為了解決多線程下的ArrayList而生的，位于java.util.cocurrent包下，就是為并發(fā)而設(shè)計的

我們聽名字其實也可以簡單的讀懂，就是寫的時候會復(fù)制一份新的數(shù)據(jù)，而事實是每一次的數(shù)據(jù)改動都會伴隨這一次數(shù)據(jù)的復(fù)制

設(shè)計的重點其實就是讀寫分離，這個思想大家再熟悉不過了吧，讀的時候不會加鎖，而寫的時候會復(fù)制一份新數(shù)據(jù)，然后加上鎖之后進行修改

老規(guī)矩，先看一段代碼，我們通過debug的方式來學(xué)習(xí)下先

public static void main(String[] args) {CopyOnWriteArrayList list = new CopyOnWriteArrayList();list.add("test1");Thread addThread = new Thread(new Runnable() {@Overridepublic void run() {list.add("test4");try {Thread.sleep(1000);} catch (InterruptedException e) {e.printStackTrace();}}});addThread.start();}

來吧，我們一起debug看下過程，順便看下源碼

加鎖用的是ReentrantLock，使用完了要記得手動釋放鎖，繼續(xù)

add的過程也是比較簡單的，先是加鎖，加鎖之后調(diào)用getArray，這個就是拿到現(xiàn)在的數(shù)組，然后取得數(shù)組的大小

接著是將原數(shù)組復(fù)制到一個大小加一的一個更大的數(shù)組中，然后將要添加的元素復(fù)制到最后的位置，最后再調(diào)用SetArray進行賦值，完成替換

我們可以通過地址很清晰的看到，新數(shù)組就是又重新開辟了一塊內(nèi)存空間，和原來數(shù)組是完全不一樣的

其實這也就意味著每次add增加元素都需要一次數(shù)組的復(fù)制

對于get獲取元素來說也沒有太多需要注意的，這個里面沒有什么額外的操作，沒有什么復(fù)制新數(shù)組一類的操作，只是簡單的從原數(shù)組取值即可

這也就意味著在多線程運行的時候，線程讀取到的數(shù)據(jù)可能不是最新的我們想要的數(shù)據(jù)，但是這種情況是需要我們考慮到的，必須在可以接受的情況下來使用

remove和iterator

分析remove過程

進去indexOf看

這個其實也很好理解，就是循環(huán)遍歷，然后通過equals判斷，相同則返回定位到的位置

當(dāng)我們想要刪除一個不存在的元素的時候，我們在這里會拿到false，因為底層定位不到會返回-1，我們進入remove方法看，這個是重點

我們再重新看一下remove的源碼

剛剛的調(diào)試是沒有走到這里面的，我們把目光聚集到這塊代碼

snapshot是剛剛的鏡像數(shù)據(jù)，這里考慮到了多線程的情況，即原有的數(shù)組可能已經(jīng)被其它的線程修改了，snapshot已經(jīng)過時的數(shù)據(jù)了，而這段處理的就是如果該數(shù)組被別的線程修改了的情況下，是如何處理的

其實根本目的就是重新定位index的值，防止誤刪別的元素

先是找到index和當(dāng)前長度中的最小值，進行遍歷，findIndex就是做這個的，在其中重新找相應(yīng)的元素，找到就就直接跳出，重新判斷

如果沒有找到元素下標(biāo)，就進行下面的判斷，index大于len的時候，代表元素被刪除或者不存在了

也不是很難理解，大家看一下這塊就可以理解了

看里面的iterator

這個迭代器和原來ArrayList中的迭代器區(qū)別點就是增加了一個快照機制，這個快照就是把遍歷時的這個最新鏈表狀態(tài)記錄了下來

此快照數(shù)組在迭代器的生存期內(nèi)是不會更改的，因此也就不可能發(fā)生沖突，也就保證了迭代器不會拋出并發(fā)修改異常

創(chuàng)建迭代器以后，迭代器不會反映列表的添加、移除和更改等修改的操作，但是也就同時帶來了一個小小的問題，遍歷拿到的數(shù)據(jù)可能不是最新的數(shù)據(jù)

需要注意的一點，ArrayList在迭代器上進行元素的更改操作是不被允許的，比如remove、set和add操作，這些方法將拋出UnsupportedOperationException異常

CopyOnWriteArrayList優(yōu)缺點分析

優(yōu)點

讀操作性能高，無需要任何的同步措施，比較適合于讀多寫少的并發(fā)場景

采用讀寫分離的思想，讀的時候讀取鏡像的數(shù)據(jù)，寫的時候復(fù)制一份新的數(shù)據(jù)進行修改操作，所以也就不會拋出并發(fā)修改異常了

存儲的數(shù)據(jù)有序，剛剛在看源碼的時候你應(yīng)該注意到了，它是先進行原數(shù)據(jù)的復(fù)制，然后再在最后位置上賦值這個要添加的數(shù)據(jù)

缺點

內(nèi)存占用問題，每次寫操作都需要將原容器數(shù)據(jù)拷貝一份，數(shù)據(jù)量比較大的時候，對內(nèi)存壓力會比較多，也有可能引起頻繁的GC

讀取的時候無法保證實時性，這也是讀寫分離付出的代價，Vector可以保證讀寫的強一致性，但是缺點上面也已經(jīng)說過了，不同的場景使用不同的容器

有道無術(shù)，術(shù)可成；有術(shù)無道，止于術(shù)

歡迎大家關(guān)注Java之道公眾號

好文章，我在看??

總結(jié)

以上是生活随笔為你收集整理的学会了CopyOnWriteArrayList可以再多和面试官对线三分钟的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： flask mvc模式开发_Flask中
下一篇：工作六年我终于学会了这项技能可惜晚了