導航:首頁 > 編程語言 > java線程內存模型

java線程內存模型

發布時間:2023-08-20 21:48:36

1. 看了這篇文章,你還敢說你了解volatile關鍵字嗎

想要理解volatile為什麼能確保可見性,就要先理解java中的內存模型是什麼樣的。

Java內存模型規定了 所有的變數都存儲在主內存中 每條線程中還有自己的工作內存,線程的工作內存中保存了被該線程所使用到的變數(這些變數是從主內存中拷貝而來) 線程對變數的所有操作(讀取,賦值)都必須在工作內存中進行。不同線程之間也無法直接訪問對方工作內存中的變數,線程間變數值的傳遞均需要通過主內存來完成

基於此種內存模型,便產生了多線程編程中的數據「臟讀」等問題。

舉個簡單的例子:在java中,執行下面這個語句:

i = 10;

執行線程必須先在自己的工作線程中對變數i所在的緩存行進行賦值操作,然後再寫入主存當中。而不是直接將數值10寫入主存當中。

比如同時有2個線程執行這段代碼,假如初始時i的值為10,那麼我們希望兩個線程執行完之後i的值變為12。但是事實會是這樣嗎?

可能存在下面一種情況:初始時,兩個線程分別讀取i的值存入各自所在的工作內存當中,然後線程1進行加1操作,然後把i的最新值11寫入到內存。此時線程2的工作內存當中i的值還是10,進行加1操作之後,i的值為11,然後線程2把i的值寫入內存。

最終結果i的值是11,而不是12。這就是著名的緩存一致性問題。通常稱這種被多個線程訪問的變數為共享變數。

那麼如何確保共享變數在多線程訪問時能夠正確輸出結果呢?

在解決這個問題之前,我們要先了解並發編程的三大概念: 原子性,有序性,可見性

1.定義

原子性:即一個操作或者多個操作 要麼全部執行並且執行的過程不會被任何因素打斷,要麼就都不執行。

2.實例

一個很經典的例子就是銀行賬戶轉賬問題:

比如從賬戶A向賬戶B轉1000元,那麼必然包括2個操作:從賬戶A減去1000元,往賬戶B加上1000元。

試想一下,如果這2個操作不具備原子性,會造成什麼樣的後果。假如從賬戶A減去1000元之後,操作突然中止。這樣就會導致賬戶A雖然減去了1000元,但是賬戶B沒有收到這個轉過來的1000元。

所以這2個操作必須要具備原子性才能保證不出現一些意外的問題。

同樣地反映到並發編程中會出現什麼結果呢?

舉個最簡單的例子,大家想一下假如為一個32位的變數賦值過程不具備原子性的話,會發生什麼後果?

假若一個線程執行到這個語句時,我暫且假設為一個32位的變數賦值包括兩個過程:為低16位賦值,為高16位賦值。

那麼就可能發生一種情況:當將低16位數值寫入之後,突然被中斷,而此時又有一個線程去讀取i的值,那麼讀取到的就是錯誤的數據。

3.Java中的原子性

在Java中, 對基本數據類型的變數的讀取和賦值操作是原子性操作 ,即這些操作是不可被中斷的,要麼執行,要麼不執行。

上面一句話雖然看起來簡單,但是理解起來並不是那麼容易。看下面一個例子i:

請分析以下哪些操作是原子性操作:

x = 10; //語句1

y = x; //語句2

x++; //語句3

x = x + 1; //語句4

咋一看,可能會說上面的4個語句中的操作都是原子性操作。其實只有語句1是原子性操作,其他三個語句都不是原子性操作。

語句1是直接將數值10賦值給x,也就是說線程執行這個語句的會直接將數值10寫入到工作內存中。

語句2實際上包含2個操作,它先要去讀取x的值,再將x的值寫入工作內存 ,雖然讀取x的值以及 將x的值寫入工作內存 這2個操作都是原子性操作,但是合起來就不是原子性操作了。

同樣的, x++和 x = x+1包括3個操作:讀取x的值,進行加1操作,寫入新的值

所以上面4個語句只有語句1的操作具備原子性。

也就是說, 只有簡單的讀取、賦值(而且必須是將數字賦值給某個變數,變數之間的相互賦值不是原子操作)才是原子操作。

從上面可以看出,Java內存模型只保證了基本讀取和賦值是原子性操作, 如果要實現更大范圍操作的原子性,可以通過synchronized和Lock來實現。由於synchronized和Lock能夠保證任一時刻只有一個線程執行該代碼塊,那麼自然就不存在原子性問題了,從而保證了原子性。

1.定義

可見性是指當多個線程訪問同一個變數時,一個線程修改了這個變數的值,其他線程能夠立即看得到修改的值。

2.實例

舉個簡單的例子,看下面這段代碼:

//線程1執行的代碼

int i = 0;

i = 10;

//線程2執行的代碼

j = i;

由上面的分析可知,當線程1執行 i =10這句時,會先把i的初始值載入到工作內存中,然後賦值為10,那麼在線程1的工作內存當中i的值變為10了,卻沒有立即寫入到主存當中。

此時線程2執行 j = i,它會先去主存讀取i的值並載入到線程2的工作內存當中,注意此時內存當中i的值還是0,那麼就會使得j的值為0,而不是10.

這就是可見性問題,線程1對變數i修改了之後,線程2沒有立即看到線程1修改的值。

3.Java中的可見性

對於可見性,Java提供了volatile關鍵字來保證可見性。

當一個共享變數被volatile修飾時,它會保證修改的值會立即被更新到主存,當有其他線程需要讀取時,它會去內存中讀取新值。

而普通的共享變數不能保證可見性, 因為普通共享變數被修改之後,什麼時候被寫入主存是不確定的,當其他線程去讀取時,此時內存中可能還是原來的舊值,因此無法保證可見性。

另外,通過synchronized和Lock也能夠保證可見性,synchronized和Lock能保證同一時刻只有一個線程獲取鎖然後執行同步代碼,並且 在釋放鎖之前會將對變數的修改刷新到主存當中 。因此可以保證可見性。

1.定義

有序性:即程序執行的順序按照代碼的先後順序執行。

2.實例

舉個簡單的例子,看下面這段代碼:

int i = 0;

boolean flag = false;

i = 1; //語句1

flag = true; //語句2

上面代碼定義了一個int型變數,定義了一個boolean類型變數,然後分別對兩個變數進行賦值操作。從代碼順序上看,語句1是在語句2前面的,那麼JVM在真正執行這段代碼的時候會保證語句1一定會在語句2前面執行嗎?不一定,為什麼呢?這里可能會發生指令重排序(Instruction Reorder)。

下面解釋一下什麼是指令重排序, 一般來說,處理器為了提高程序運行效率,可能會對輸入代碼進行優化,它不保證程序中各個語句的執行先後順序同代碼中的順序一致,但是它會保證程序最終執行結果和代碼順序執行的結果是一致的。

比如上面的代碼中,語句1和語句2誰先執行對最終的程序結果並沒有影響,那麼就有可能在執行過程中,語句2先執行而語句1後執行。

但是要注意,雖然處理器會對指令進行重排序,但是它會保證程序最終結果會和代碼順序執行結果相同,那麼它靠什麼保證的呢?再看下面一個例子:

int a = 10; //語句1

int r = 2; //語句2

a = a + 3; //語句3

r = a*a; //語句4

這段代碼有4個語句,那麼可能的一個執行順序是:

那麼可不可能是這個執行順序呢: 語句2 語句1 語句4 語句3

不可能,因為處理器在進行重排序時是會考慮指令之間的數據依賴性,如果一個指令Instruction 2必須用到Instruction 1的結果,那麼處理器會保證Instruction 1會在Instruction 2之前執行。

雖然重排序不會影響單個線程內程序執行的結果,但是多線程呢?下面看一個例子:

上面代碼中,由於語句1和語句2沒有數據依賴性,因此可能會被重排序。假如發生了重排序,在線程1執行過程中先執行語句2,而此是線程2會以為初始化工作已經完成,那麼就會跳出while循環,去執行doSomethingwithconfig(context)方法,而此時context並沒有被初始化,就會導致程序出錯。

從上面可以看出, 指令重排序不會影響單個線程的執行,但是會影響到線程並發執行的正確性。

也就是說, 要想並發程序正確地執行,必須要保證原子性、可見性以及有序性。只要有一個沒有被保證,就有可能會導致程序運行不正確。

3.Java中的有序性

在Java內存模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單線程程序的執行,卻會影響到多線程並發執行的正確性。

在Java裡面,可以通過volatile關鍵字來保證一定的「有序性」。另外可以通過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每個時刻是有一個線程執行同步代碼,相當於是讓線程順序執行同步代碼,自然就保證了有序性。

另外,Java內存模型具備一些先天的「有序性」, 即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為 happens-before 原則。如果兩個操作的執行次序無法從happens-before原則推導出來,那麼它們就不能保證它們的有序性,虛擬機可以隨意地對它們進行重排序。

下面就來具體介紹下happens-before原則(先行發生原則):

①程序次序規則:一個線程內,按照代碼順序,書寫在前面的操作先行發生於書寫在後面的操作

②鎖定規則:一個unLock操作先行發生於後面對同一個鎖額lock操作

③volatile變數規則:對一個變數的寫操作先行發生於後面對這個變數的讀操作

④傳遞規則:如果操作A先行發生於操作B,而操作B又先行發生於操作C,則可以得出操作A先行發生於操作C

⑤線程啟動規則:Thread對象的start()方法先行發生於此線程的每個一個動作

⑥線程中斷規則:對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生

⑦線程終結規則:線程中所有的操作都先行發生於線程的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行

⑧對象終結規則:一個對象的初始化完成先行發生於他的finalize()方法的開始

這8條規則中,前4條規則是比較重要的,後4條規則都是顯而易見的。

下面我們來解釋一下前4條規則:

對於程序次序規則來說,就是一段程序代碼的執行 在單個線程中看起來是有序的 。注意,雖然這條規則中提到「書寫在前面的操作先行發生於書寫在後面的操作」,這個應該是程序看起來執行的順序是按照代碼順序執行的, 但是虛擬機可能會對程序代碼進行指令重排序 。雖然進行重排序,但是最終執行的結果是與程序順序執行的結果一致的,它只會對不存在數據依賴性的指令進行重排序。因此, 在單個線程中,程序執行看起來是有序執行的 ,這一點要注意理解。事實上, 這個規則是用來保證程序在單線程中執行結果的正確性,但無法保證程序在多線程中執行的正確性。

第二條規則也比較容易理解,也就是說無論在單線程中還是多線程中, 同一個鎖如果處於被鎖定的狀態,那麼必須先對鎖進行了釋放操作,後面才能繼續進行lock操作。

第三條規則是一條比較重要的規則。直觀地解釋就是, 如果一個線程先去寫一個變數,然後一個線程去進行讀取,那麼寫入操作肯定會先行發生於讀操作。

第四條規則實際上就是體現happens-before原則 具備傳遞性

1.volatile保證可見性

一旦一個共享變數(類的成員變數、類的靜態成員變數)被volatile修飾之後,那麼就具備了兩層語義:

1)保證了 不同線程對這個變數進行操作時的可見性 ,即一個線程修改了某個變數的值,這新值對其他線程來說是立即可見的。

2) 禁止進行指令重排序。

先看一段代碼,假如線程1先執行,線程2後執行:

這段代碼是很典型的一段代碼,很多人在中斷線程時可能都會採用這種標記辦法。但是事實上,這段代碼會完全運行正確么?即一定會將線程中斷么?不一定,也許在大多數時候,這個代碼能夠把線程中斷,但是也有可能會導致無法中斷線程(雖然這個可能性很小,但是只要一旦發生這種情況就會造成死循環了)。

下面解釋一下這段代碼為何有可能導致無法中斷線程。在前面已經解釋過,每個線程在運行過程中都有自己的工作內存,那麼線程1在運行的時候,會將stop變數的值拷貝一份放在自己的工作內存當中。

那麼當線程2更改了stop變數的值之後,但是還沒來得及寫入主存當中,線程2轉去做其他事情了,那麼線程1由於不知道線程2對stop變數的更改,因此還會一直循環下去。

但是用volatile修飾之後就變得不一樣了:

第一:使用volatile關鍵字會 強制將修改的值立即寫入主存

第二:使用volatile關鍵字的話,當線程2進行修改時, 會導致線程1的工作內存中緩存變數stop的緩存行無效 (反映到硬體層的話,就是CPU的L1或者L2緩存中對應的緩存行無效);

第三:由於線程1的工作內存中緩存變數stop的緩存行無效,所以 線程1再次讀取變數stop的值時會去主存讀取

那麼在線程2修改stop值時(當然這里包括2個操作,修改線程2工作內存中的值,然後將修改後的值寫入內存),會使得線程1的工作內存中緩存變數stop的緩存行無效,然後線程1讀取時,發現自己的緩存行無效,它會等待緩存行對應的主存地址被更新之後,然後去對應的主存讀取最新的值。

那麼線程1讀取到的就是最新的正確的值。

2.volatile不能確保原子性

下面看一個例子:

大家想一下這段程序的輸出結果是多少?也許有些朋友認為是10000。但是事實上運行它會發現每次運行結果都不一致,都是一個小於10000的數字。

可能有的朋友就會有疑問,不對啊,上面是對變數inc進行自增操作,由於volatile保證了可見性,那麼在每個線程中對inc自增完之後,在其他線程中都能看到修改後的值啊,所以有10個線程分別進行了1000次操作,那麼最終inc的值應該是1000*10=10000。

這裡面就有一個誤區了, volatile關鍵字能保證可見性沒有錯,但是上面的程序錯在沒能保證原子性。 可見性只能保證每次讀取的是最新的值,但是volatile沒辦法保證對變數的操作的原子性。

在前面已經提到過, 自增操作是不具備原子性的,它包括讀取變數的原始值、進行加1操作、寫入工作內存 。那麼就是說自增操作的三個子操作可能會分割開執行,就有可能導致下面這種情況出現:

假如某個時刻變數inc的值為10,

線程1對變數進行自增操作,線程1先讀取了變數inc的原始值,然後線程1被阻塞了

然後線程2對變數進行自增操作,線程2也去讀取變數inc的原始值, 由於線程1隻是對變數inc進行讀取操作,而沒有對變數進行修改操作,所以不會導致線程2的工作內存中緩存變數inc的緩存行無效,也不會導致主存中的值刷新, 所以線程2會直接去主存讀取inc的值,發現inc的值時10,然後進行加1操作,並把11寫入工作內存,最後寫入主存。

然後線程1接著進行加1操作,由於已經讀取了inc的值,注意此時在線程1的工作內存中inc的值仍然為10,所以線程1對inc進行加1操作後inc的值為11,然後將11寫入工作內存,最後寫入主存。

那麼兩個線程分別進行了一次自增操作後,inc只增加了1。

根源就在這里,自增操作不是原子性操作,而且volatile也無法保證對變數的任何操作都是原子性的。

解決方案:可以通過synchronized或lock,進行加鎖,來保證操作的原子性。也可以通過AtomicInteger。

在java 1.5的java.util.concurrent.atomic包下提供了一些 原子操作類 ,即對基本數據類型的 自增(加1操作),自減(減1操作)、以及加法操作(加一個數),減法操作(減一個數)進行了封裝,保證這些操作是原子性操作。 atomic是利用CAS來實現原子性操作的(Compare And Swap) ,CAS實際上是 利用處理器提供的CMPXCHG指令實現的,而處理器執行CMPXCHG指令是一個原子性操作。

3.volatile保證有序性

在前面提到volatile關鍵字能禁止指令重排序,所以volatile能在一定程度上保證有序性。

volatile關鍵字禁止指令重排序有兩層意思:

1)當程序執行到volatile變數的讀操作或者寫操作時, 在其前面的操作的更改肯定全部已經進行,且結果已經對後面的操作可見;在其後面的操作肯定還沒有進行

2)在進行指令優化時, 不能將在對volatile變數的讀操作或者寫操作的語句放在其後面執行,也不能把volatile變數後面的語句放到其前面執行。

可能上面說的比較繞,舉個簡單的例子:

由於 flag變數為volatile變數 ,那麼在進行指令重排序的過程的時候, 不會將語句3放到語句1、語句2前面,也不會講語句3放到語句4、語句5後面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。

並且volatile關鍵字能保證, 執行到語句3時,語句1和語句2必定是執行完畢了的,且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。

那麼我們回到前面舉的一個例子:

//線程1:

context = loadContext(); //語句1

inited = true; //語句2

//線程2:

while(!inited ){

sleep()

}

doSomethingwithconfig(context);

前面舉這個例子的時候,提到有可能語句2會在語句1之前執行,那麼久可能導致context還沒被初始化,而線程2中就使用未初始化的context去進行操作,導致程序出錯。

這里如果用volatile關鍵字對inited變數進行修飾,就不會出現這種問題了, 因為當執行到語句2時,必定能保證context已經初始化完畢。

1.可見性

處理器為了提高處理速度,不直接和內存進行通訊,而是將系統內存的數據獨到內部緩存後再進行操作,但操作完後不知什麼時候會寫到內存。

2.有序性

Lock前綴指令實際上相當於一個內存屏障(也成內存柵欄),它確保 指令重排序時不會把其後面的指令排到內存屏障之前的位置,也不會把前面的指令排到內存屏障的後面; 即在執行到內存屏障這句指令時,在它前面的操作已經全部完成。

synchronized關鍵字是防止多個線程同時執行一段代碼,那麼就會很影響程序執行效率,而volatile關鍵字在某些情況下性能要優於synchronized,但是要注意volatile關鍵字是無法替代synchronized關鍵字的,因為volatile關鍵字無法保證操作的原子性。通常來說,使用volatile必須具備以下2個條件:

1)對變數的寫操作不依賴於當前值

2)該變數沒有包含在具有其他變數的不變式中

下面列舉幾個Java中使用volatile的幾個場景。

①.狀態標記量

volatile boolean flag = false;

//線程1

while(!flag){

doSomething();

}

//線程2

public void setFlag() {

flag = true;

}

根據狀態標記,終止線程。

②.單例模式中的double check

為什麼要使用volatile 修飾instance?

主要在於instance = new Singleton()這句,這並非是一個原子操作,事實上在 JVM 中這句話大概做了下面 3 件事情:

但是在 JVM 的即時編譯器中存在指令重排序的優化。也就是說上面的第二步和第三步的順序是不能保證的,最終的執行順序可能是 1-2-3 也可能是 1-3-2。如果是後者,則在 3 執行完畢、2 未執行之前,被線程二搶佔了,這時 instance 已經是非 null 了(但卻沒有初始化),所以線程二會直接返回 instance,然後使用,然後順理成章地報錯。

自己是從事了七年開發的Android工程師,不少人私下問我,2019年Android進階該怎麼學,方法有沒有?

沒錯,年初我花了一個多月的時間整理出來的學習資料,希望能幫助那些想進階提升Android開發,卻又不知道怎麼進階學習的朋友。【 包括高級UI、性能優化、架構師課程、NDK、Kotlin、混合式開發(ReactNative+Weex)、Flutter等架構技術資料 】,希望能幫助到您面試前的復習且找到一個好的工作,也節省大家在網上搜索資料的時間來學習。

2. java並發(1)線程模型

程序並不能單獨運行,只有將程序裝載到內存中,系統為它分配資源才能運行,而這種執行的程序就稱之為進程。程序和進程的區別就在於:程序是指令的集合,它是進程運行的靜態描述文本;進程是程序的一次執行活動,屬於動態概念

主要歸咎於兩點. 一個是由實現決定的,一個是由需求決定的.

線程由線程ID,程序計數器(PC)[用於指向內存中的程序指令],寄存器集合[由於存放本地變數和臨時變數]和堆棧[用於存放方法指令和方法參數等]組成。

以 Unix/Linux 的體系架構為例。

因為操作系統的資源是有限的,如果訪問資源的操作過多,必然會消耗過多的資源,而且如果不對這些操作加以區分,很可能造成資源訪問的沖突。所以,為了減少有限資源的訪問和使用沖突,對不同的操作賦予不同的執行等級(有多大能力做多大的事),用戶態(User Mode)和內核態(Kernel Mode)。

運行於用戶態的進程可以執行的操作和訪問的資源都會受到極大的限制,而運行在內核態的進程則可以執行任何操作並且在資源的使用上沒有限制。

並發 :一個時間段內有很多的線程或進程在執行,但何時間點上都只有一個在執行,多個線程或進程爭搶時間片輪流執行。

並行 :一個時間段和時間點上都有多個線程或進程在執行。

線程有三種模型, 一對一,多對一,多對多.具體參考 一篇文章讀懂Java多線程模型 , 這里只描述一對一的情況.

每個用戶線程都映射到一個內核線程,每個線程都成為一個獨立的調度單元,由內核調度器獨立調度,一個線程的阻塞不會影響到其他線程,從而保障整個進程繼續工作.

JVM 沒有限定 Java 線程需要使用哪種線程模型來實現, JVM 只是封裝了底層操作系統的差異,而不同的操作系統可能使用不同的線程模型,例如 Linux 和 windows 可能使用了一對一模型,solaris 和 unix 某些版本可能使用多對多模型。所以一談到 Java 語言的多線程模型,需要針對具體 JVM 實現。

Sun JDK 1.2開始,線程模型都是基於操作系統原生線程模型來實現,它的 Window 版和 Linux 版都是使用系統的 1:1 的線程模型實現的。

3. 內存條abcd分布

java內存區域主要分程序計數器、Java虛擬機棧、本地方法棧、Java堆、方法區、直接內存。其中程序計數器、Java虛擬機棧、本地方法棧屬於線程隔離,即他們都有自己的線程歸屬,其他屬於線程共享的。
1、程序計數器。這個是當前線程正在執行的位元組碼行號指示器。根據這裡面的內存數據來確定程序接下來執行的指令。每個線程都有一個,相互隔離,線程切換回來時才知道怎麼執行。如果執行的是方法,這里記錄的是虛擬機位元組碼指令的地址。當執行的是Native方法的時候為空(Undefined)。
2、Java虛擬機棧。每個線程私有,裡面裝的多個棧幀,每個棧幀對於的一個方法。裡面存儲的是Java方法的內存模型。相當於描述的是一個方法需要的內容。
3、本地方法棧。線程私有,和上一個Java虛擬機棧作用相似,Java虛擬機棧是為Java方法服務,本地方法棧是為Native服務。
4、Java虛擬機管理最大的一塊,線程共享,存放對象實例和數組。分新生代(1/3)和老年代(2/3),新生代還可以分Eden(8/10)、FromSurvivor(1/10)、ToSurvivor(1/10),是主要根據垃圾清理來分的。
5、方法區。線程共享,主要存儲被虛擬機載入的類信息、常量、靜態變數、即時編譯器編譯後的代碼。運行時常量池也是方法區的一部分,比如String有一個常量池,他就是放到這個裡面的。
6、直接內存。NIO通過使用Native函數庫直接分配對外內存。

閱讀全文

與java線程內存模型相關的資料

熱點內容
臉部識別演算法模型廠家 瀏覽:176
反編譯的程序帶注釋嗎 瀏覽:713
安裝軟體伺服器未響應怎麼解決 瀏覽:531
閥門開度單片機 瀏覽:568
python多線程有什麼坑 瀏覽:679
程序員從互聯網跳槽到銀行里 瀏覽:242
百度網盤資源解壓後暫不支持在線 瀏覽:220
android自動化環境 瀏覽:253
androidrealm加密 瀏覽:513
地圖正在解壓縮是什麼意思 瀏覽:217
電腦軟體能放在文件夾嗎 瀏覽:786
uc伺服器怎麼打開 瀏覽:363
net怎麼編譯 瀏覽:244
我的世界187伺服器地址ip 瀏覽:955
拍賣房價的演算法 瀏覽:440
linux內核編譯視頻教程 瀏覽:883
程序員厚黑 瀏覽:210
如何在閑魚淘二手安卓機 瀏覽:177
怎麼下載晨星app 瀏覽:135
兩台伺服器如何同步內容 瀏覽:810