현재 램 부족 사태의 가장 큰 원흉
# 베라 루빈 NVL72 상세 요약
- CPU: Vera CPU 36개 (88코어 Arm 기반 Olympus 커스텀 코어, LPDDR5X 메모리 최대 1.5TB 지원)
- GPU: Rubin GPU 72개 (HBM4 메모리 탑재, GPU당 288GB, Transformer Engine 지원)
- 슈퍼칩 단위: Vera CPU 1개 + Rubin GPU 2개 결합
- 기타 칩: NVLink 6 스위치, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 Ethernet 스위치 등 6개 칩 극한 공동 설계
## 성능 (Blackwell 대비)
- 추론(Inference): 5배 향상 (NVFP4 기준 3.6 EFLOPS, GPU당 50 PFLOPS)
- 훈련(Training): 3.5배 향상 (NVFP4 기준 2.5 EFLOPS)
- 토큰당 비용: MoE 모델 기준 10분의 1 수준 (추론 비용 대폭 절감)
- MoE 모델 훈련: 필요한 GPU 수 4분의 1로 감소
- 메모리: HBM4 20.7TB + LPDDR5X 54TB
- 대역폭: NVLink 6로 GPU당 3.6 TB/s, 랙 전체 260 TB/s (인터넷 전체 대역폭 초과)
램을 몇층씩 적층으로 쌓은 HBM4를 '테라'단위로 씀.
시스템 구조라 1GPU당은 288GB,
이런데 램이 안 부족하면 그게 더 신기할 지경임
0 Comments
/var/www/issuya.com/skin/board/issuya/view/tto_basic
지금 뜨고있는 이슈
6
7744
4
6048
1
5096
0
4705
1
4667
2
4413
1
4177
1
3704
3
3444
0
3313
0
2539
1
2523
0
2410
1
2202
0
2052
0
1977
1
1909
0
1570
1
1336
0
1320
Today
pick
Array
(
[icon] =>
[strong] =>
[modal] =>
[dtype] =>
[rows] => 10
[page] => 1
[comment] =>
[main] =>
[bo_list] => issue
[gr_list] =>
[ca_list] =>
[newtime] =>
[new] => black
[sort] => hit
[rank] => black
[term] => day
[dayterm] => 2
[mb_list] =>
[cache] => 0
[modal_js] =>
)
1
Array
(
[icon] =>
[strong] =>
[modal] =>
[dtype] =>
[date] => 1
[rows] => 10
[page] => 1
[comment] =>
[main] =>
[bo_list] => issue
[gr_list] =>
[ca_list] =>
[newtime] =>
[new] => black
[sort] => comment
[rank] => black
[term] => week
[dayterm] => 2
[mb_list] =>
[cache] => 0
[modal_js] =>
)
1
Array
(
[icon] =>
[strong] =>
[modal] =>
[dtype] =>
[rows] => 10
[page] => 1
[comment] =>
[main] => 1
[bo_list] => issue
[gr_list] =>
[ca_list] =>
[newtime] =>
[new] => color
[sort] =>
[rank] => darkred
[term] =>
[dayterm] => 3
[mb_list] =>
[cache] => 0
[modal_js] =>
)
1
basic-post-list issue-basic-post-list-pick