NUMA架构和Java
這些具有巨大內(nèi)核的盒子帶有非統(tǒng)一內(nèi)存訪問(wèn)(NUMA)架構(gòu)。 NUMA是一種可提高本地節(jié)點(diǎn)的內(nèi)存訪問(wèn)性能的體系結(jié)構(gòu)。 這些新的硬件盒分為稱為節(jié)點(diǎn)的不同區(qū)域。 這些節(jié)點(diǎn)具有一定數(shù)量的核心,并分配有一部分內(nèi)存。 因此,對(duì)于具有1 TB RAM和80個(gè)核心的機(jī)箱,我們有4個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)具有20個(gè)核心和256 GB的內(nèi)存分配。
您可以使用命令numactl --hardware
>numactl --hardware available: 4 nodes (0-3) node 0 size: 258508 MB node 0 free: 186566 MB node 1 size: 258560 MB node 1 free: 237408 MB node 2 size: 258560 MB node 2 free: 234198 MB node 3 size: 256540 MB node 3 free: 237182 MB node distances: node 0 1 2 3 0: 10 20 20 20 1: 20 10 20 20 2: 20 20 10 20 3: 20 20 20 10JVM啟動(dòng)時(shí),它將啟動(dòng)線程,這些線程是在某些隨機(jī)節(jié)點(diǎn)的內(nèi)核上調(diào)度的。 每個(gè)線程都盡可能快地使用其本地內(nèi)存。 線程可能在某個(gè)時(shí)候處于WAITING狀態(tài),并在CPU上重新調(diào)度。 這次不能保證它將在同一節(jié)點(diǎn)上。 現(xiàn)在這一次,它必須訪問(wèn)一個(gè)遠(yuǎn)程存儲(chǔ)位置,這會(huì)增加延遲。 遠(yuǎn)程存儲(chǔ)器訪問(wèn)速度較慢,因?yàn)橹噶畋仨毐闅v互連鏈路,從而引入額外的躍點(diǎn)。
Linux命令numactl提供了一種僅將進(jìn)程綁定到某些節(jié)點(diǎn)的方法。 它將進(jìn)程鎖定到特定節(jié)點(diǎn),以執(zhí)行和分配內(nèi)存。 如果將JVM實(shí)例鎖定到單個(gè)節(jié)點(diǎn),則將刪除節(jié)點(diǎn)間的流量,并且所有內(nèi)存訪問(wèn)都將在快速本地內(nèi)存上進(jìn)行。
numactl --cpunodebind=nodes, -c nodes Only execute process on the CPUs of nodes.創(chuàng)建了一個(gè)小型測(cè)試,該測(cè)試試圖序列化一個(gè)大對(duì)象并計(jì)算每秒的事務(wù)和延遲。
要執(zhí)行綁定到一個(gè)節(jié)點(diǎn)的Java進(jìn)程,請(qǐng)執(zhí)行
numactl --cpunodebind=0 java -Dthreads=10 -jar serializationTest.jar將此測(cè)試運(yùn)行在兩個(gè)不同的盒子上。
盒子A
4個(gè)CPU x 10核x 2(超線程)=總共80核
節(jié)點(diǎn):0,1,2,3
方塊B
2個(gè)CPU x 10個(gè)內(nèi)核x 2個(gè)(超線程)=總共40個(gè)內(nèi)核
節(jié)點(diǎn):0,1
CPU速度:兩者均為2.4 GHz。
默認(rèn)設(shè)置也使用框中可用的所有節(jié)點(diǎn)。
| 框 | NUMA政策 | TPS | 延遲 (平均) | 延遲 (分鐘) |
| 一個(gè) | 默認(rèn) | 261 | 37 | 18歲 |
| 乙 | 默認(rèn) | 387 | 25 | 5 |
| 一個(gè) | –cpunodebind = 0,1 | 405 | 23 | 3 |
| 乙 | –cpunodebind = 0 | 1,613 | 5 | 3 |
| 一個(gè) | –cpunodebind = 0 | 1,619 | 5 | 3 |
因此,我們可以推斷出,與“ 2個(gè)節(jié)點(diǎn)” Box B上的默認(rèn)設(shè)置相比,“節(jié)點(diǎn)較多”的Box A上的默認(rèn)設(shè)置在“ CPU密集型”測(cè)試中的性能較低。更好。 可能是因?yàn)樗墓?jié)點(diǎn)跳數(shù)更少,并且線程被重新調(diào)度的概率增加到50%。
當(dāng)--cpunodebind=0 ,它的表現(xiàn)要優(yōu)于所有情況。
注意:以上測(cè)試是在10個(gè)內(nèi)核上使用10個(gè)線程運(yùn)行的。
測(cè)試罐: 下載
測(cè)試源: 下載
參考:來(lái)自我們的JCG合作伙伴 Himadri Singh的NUMA和Java ,在Billions&Terabytes博客上。
翻譯自: https://www.javacodegeeks.com/2012/09/numa-architecture-and-java.html
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)總結(jié)
以上是生活随笔為你收集整理的NUMA架构和Java的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Spring–添加AOP支持
- 下一篇: 电脑对比度 电脑对比度和亮度在哪里调节