當(dāng)前位置：首頁(yè) > 编程语言 > java >内容正文

java

NUMA架构和Java

發(fā)布時(shí)間：2023/12/3 java 30 豆豆

生活随笔收集整理的這篇文章主要介紹了 NUMA架构和Java 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

是時(shí)候部署您的應(yīng)用程序了，期待著采購(gòu)最適合負(fù)載要求的硬件。如今，具有40核或80核的包裝盒非常普遍。總體概念是更多的內(nèi)核，更多的處理能力，更多的吞吐量。但是我看到了一些相反的結(jié)果，表明小型的CPU密集型測(cè)試運(yùn)行在80核盒上的性能要比較小的40核盒慢。

這些具有巨大內(nèi)核的盒子帶有非統(tǒng)一內(nèi)存訪問(wèn)（NUMA）架構(gòu)。 NUMA是一種可提高本地節(jié)點(diǎn)的內(nèi)存訪問(wèn)性能的體系結(jié)構(gòu)。這些新的硬件盒分為稱為節(jié)點(diǎn)的不同區(qū)域。這些節(jié)點(diǎn)具有一定數(shù)量的核心，并分配有一部分內(nèi)存。因此，對(duì)于具有1 TB RAM和80個(gè)核心的機(jī)箱，我們有4個(gè)節(jié)點(diǎn)，每個(gè)節(jié)點(diǎn)具有20個(gè)核心和256 GB的內(nèi)存分配。

您可以使用命令numactl --hardware

>numactl --hardware available: 4 nodes (0-3) node 0 size: 258508 MB node 0 free: 186566 MB node 1 size: 258560 MB node 1 free: 237408 MB node 2 size: 258560 MB node 2 free: 234198 MB node 3 size: 256540 MB node 3 free: 237182 MB node distances: node 0 1 2 3 0: 10 20 20 20 1: 20 10 20 20 2: 20 20 10 20 3: 20 20 20 10

JVM啟動(dòng)時(shí)，它將啟動(dòng)線程，這些線程是在某些隨機(jī)節(jié)點(diǎn)的內(nèi)核上調(diào)度的。每個(gè)線程都盡可能快地使用其本地內(nèi)存。線程可能在某個(gè)時(shí)候處于WAITING狀態(tài)，并在CPU上重新調(diào)度。這次不能保證它將在同一節(jié)點(diǎn)上。現(xiàn)在這一次，它必須訪問(wèn)一個(gè)遠(yuǎn)程存儲(chǔ)位置，這會(huì)增加延遲。遠(yuǎn)程存儲(chǔ)器訪問(wèn)速度較慢，因?yàn)橹噶畋仨毐闅v互連鏈路，從而引入額外的躍點(diǎn)。

Linux命令numactl提供了一種僅將進(jìn)程綁定到某些節(jié)點(diǎn)的方法。它將進(jìn)程鎖定到特定節(jié)點(diǎn)，以執(zhí)行和分配內(nèi)存。如果將JVM實(shí)例鎖定到單個(gè)節(jié)點(diǎn)，則將刪除節(jié)點(diǎn)間的流量，并且所有內(nèi)存訪問(wèn)都將在快速本地內(nèi)存上進(jìn)行。

numactl --cpunodebind=nodes, -c nodes Only execute process on the CPUs of nodes.

創(chuàng)建了一個(gè)小型測(cè)試，該測(cè)試試圖序列化一個(gè)大對(duì)象并計(jì)算每秒的事務(wù)和延遲。

要執(zhí)行綁定到一個(gè)節(jié)點(diǎn)的Java進(jìn)程，請(qǐng)執(zhí)行

numactl --cpunodebind=0 java -Dthreads=10 -jar serializationTest.jar

將此測(cè)試運(yùn)行在兩個(gè)不同的盒子上。

盒子A
4個(gè)CPU x 10核x 2（超線程）=總共80核
節(jié)點(diǎn)：0,1,2,3

方塊B
2個(gè)CPU x 10個(gè)內(nèi)核x 2個(gè)（超線程）=總共40個(gè)內(nèi)核
節(jié)點(diǎn)：0,1

CPU速度：兩者均為2.4 GHz。
默認(rèn)設(shè)置也使用框中可用的所有節(jié)點(diǎn)。

框	NUMA政策	TPS	延遲（平均）	延遲（分鐘）
一個(gè)	默認(rèn)	261	37	18歲
乙	默認(rèn)	387	25	5
一個(gè)	–cpunodebind = 0,1	405	23	3
乙	–cpunodebind = 0	1,613	5	3
一個(gè)	–cpunodebind = 0	1,619	5	3

因此，我們可以推斷出，與“ 2個(gè)節(jié)點(diǎn)” Box B上的默認(rèn)設(shè)置相比，“節(jié)點(diǎn)較多”的Box A上的默認(rèn)設(shè)置在“ CPU密集型”測(cè)試中的性能較低。更好。可能是因?yàn)樗墓?jié)點(diǎn)跳數(shù)更少，并且線程被重新調(diào)度的概率增加到50％。

當(dāng)--cpunodebind=0 ，它的表現(xiàn)要優(yōu)于所有情況。

注意：以上測(cè)試是在10個(gè)內(nèi)核上使用10個(gè)線程運(yùn)行的。

測(cè)試罐：下載
測(cè)試源：下載

參考：來(lái)自我們的JCG合作伙伴 Himadri Singh的NUMA和Java ，在Billions＆Terabytes博客上。

翻譯自: https://www.javacodegeeks.com/2012/09/numa-architecture-and-java.html

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯，堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

總結(jié)

以上是生活随笔為你收集整理的NUMA架构和Java的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Spring–添加AOP支持
下一篇：电脑对比度电脑对比度和亮度在哪里调节

国产亚洲精品久久久久动-影视先锋中文字幕-av网站在线观看一区-亚洲视频 在线观看-久久亚洲不卡-欧美精品一区在线观看-欧美乱淫视频-欧美熟妇另类久久久久久不卡-粉嫩av一区二区三区四区五区-日韩欧美操

java

NUMA架构和Java

總結(jié)

国产亚洲精品久久久久动-影视先锋中文字幕-av网站在线观看一区-亚洲视频在线观看-久久亚洲不卡-欧美精品一区在线观看-欧美乱淫视频-欧美熟妇另类久久久久久不卡-粉嫩av一区二区三区四区五区-日韩欧美操