HBM 반도체가 AI 시대의 핵심 부품으로 떠오른 이유와 SK하이닉스가 글로벌 AI 메모리 시장을 선점한 배경을 알기 쉽게 정리했습니다. HBM4까지 세대별 특징과 2026년 공급 현황을 한 번에.

뉴스를 보다 보면 SK하이닉스 얘기가 계속 나옵니다.
젠슨 황 엔비디아 CEO가 최태원 SK그룹 회장과 어깨동무로 찍은 사진, 시가총액이 16개월 만에 열 배 가까이 뛴 차트... 그런데 뉴스마다 반복되는 'HBM'이 정확히 뭔지, 왜 이게 이렇게 중요한지 선뜻 설명하기 어려웠던 분들 많으실 거예요.
HBM 반도체는 AI 칩 옆에서 작동하는 '초고속 메모리 규격'입니다. 이걸 이해하면 AI 반도체 뉴스가 훨씬 선명하게 읽힙니다.
GPU가 아무리 빨라도 메모리가 따라가지 못하면 의미 없어요
AI 모델은 엄청난 양의 데이터를 쉴 새 없이 처리합니다.
챗GPT 같은 대규모 언어 모델이 답변 한 줄을 생성하는 동안에도 수천억 개 파라미터가 GPU와 메모리 사이를 끊임없이 왕복해요. GPU 연산 속도가 아무리 빨라져도, 메모리에서 데이터를 건네는 속도가 받쳐주지 못하면 GPU가 데이터를 기다리며 노는 상태가 생깁니다. 이걸 '메모리 월(Memory Wall)' 이라고 부릅니다.
기존 DDR5나 GDDR 메모리는 GPU 옆에 평평하게 배치해 기판을 통해 데이터를 주고받는 구조예요. 속도를 올려도 물리적 거리와 대역폭 한계가 따라다닙니다. HBM 반도체는 이 문제를 구조 자체를 바꿔서 해결했습니다.
HBM 반도체, 칩을 세로로 쌓아 올렸더니 달라졌어요
HBM(High Bandwidth Memory, 고대역폭 메모리)은 DRAM을 여러 층으로 수직 적층하고, TSV(Through-Silicon Via, 관통 실리콘 비아)라는 미세 연결 구조로 층과 층을 꿰어 데이터를 주고받는 방식입니다.
핵심 원리는 세 가지예요.
- 수직 적층: 메모리 다이(Die) 12~16장을 위로 차곡차곡 쌓습니다
- TSV 연결: 층마다 수천~수만 개의 미세 구멍을 뚫어 전기 신호를 수직으로 통과시킵니다
- GPU 초근접 배치: 인터포저(Interposer) 기판 위에 GPU와 HBM을 바짝 붙여 설치합니다
이 구조 덕분에 데이터 이동 경로가 극적으로 짧아지고, 동시에 통과하는 데이터 폭(버스 폭)이 기존 대비 8~16배 이상 넓어집니다. 마치 2차선 도로를 32차선으로 확장한 셈이에요. 에너지 효율도 기존 DRAM 대비 크게 높아집니다.

세대가 바뀔 때마다 AI GPU 성능이 뛰어오른 배경
HBM 반도체는 1세대부터 지금까지 세대를 거듭하며 성능이 지수적으로 올라왔습니다.
| 세대 | 스택당 대역폭 | 스택당 최대 용량 | 채택 AI GPU (예시) |
|---|---|---|---|
| HBM2E | 461 GB/s | 24 GB | AMD MI250 |
| HBM3 | 819 GB/s | 24 GB | 엔비디아 H100 (ChatGPT 시대) |
| HBM3E | 1,229 GB/s | 48 GB | 엔비디아 B200 (블랙웰) |
| HBM4 | 2,048 GB/s | 64 GB | 엔비디아 Vera Rubin (2026~) |
엔비디아 GPU 기준으로 보면 변화가 더 실감납니다. H100(2022년)은 HBM3 80GB에 초당 3.35TB 대역폭이었는데, B200(2024년)은 HBM3E 192GB에 초당 8TB로 올라갔어요. 곧 양산될 Vera Rubin은 HBM4 288GB, 초당 13~15TB가 전망됩니다.
GPU 한 대에 들어가는 HBM 스택 수도 5개(H100)에서 8개(B200)로 늘었습니다. GPU 한 세대가 바뀔 때마다 HBM 반도체 수요는 단순히 늘어나는 게 아니라 기하급수적으로 폭발하는 이유가 여기 있습니다.
SK하이닉스가 이 시장을 선점한 배경
HBM은 SK하이닉스와 AMD가 2008년부터 공동 개발해온 기술입니다. 결정적 전환점이 온 건 2022년 11월, ChatGPT 출시 이후예요.
엔비디아 H100 수요가 폭발하자 H100에 탑재되는 HBM3의 유일한 납품사가 SK하이닉스였습니다. 하이닉스의 단독 공급 구조가 하루아침에 글로벌 AI 인프라의 병목 지점이 됐습니다.
이후 3사 구도는 이렇습니다.
SK하이닉스: HBM3E 양산을 2024년 3월 가장 먼저 시작했고, HBM4 개발 완료를 2025년 9월 선언했습니다. 2026년 기준 글로벌 HBM 출하량 점유율 62%, 매출 점유율 57%예요. 엔비디아 차세대 플랫폼 Vera Rubin에 공급될 HBM4 물량의 약 70%를 확보한 것으로 알려져 있습니다.
삼성전자: 2025년 9월 12단 HBM3E 엔비디아 공인을 받았지만, 주력 배분은 AMD MI350 라인과 중국향 제품으로 향했습니다. HBM4 공급 계약을 체결했고, HBM4E(2027년)도 로드맵에 올라있어요.
마이크론: 미국 유일의 DRAM 대규모 생산사로, HBM3E에서 업계 최고 전력 효율을 내세웠습니다. 2026년 HBM 생산 물량 전량이 장기 계약으로 이미 소화된 상태입니다.
2026년 지금, HBM은 왜 이렇게 부족한가요

HBM 수요는 AI 인프라 투자와 직결됩니다.
2026년 글로벌 하이퍼스케일러(마이크로소프트·구글·아마존·메타 등)의 설비투자는 약 6,000~7,000억 달러로 추산되고, 이 돈의 상당 부분이 AI 데이터센터로 들어갑니다. AI 데이터센터에는 HBM 반도체가 없으면 안 되고요.
문제는 공급이에요.
HBM 생산은 일반 DRAM 대비 3~4배 많은 웨이퍼 공정이 필요합니다. 12~16장 적층 자체도 고난도 공정이고, 새 공장을 짓는 데는 2~3년이 걸려요. SK하이닉스 CFO는 "2026년 HBM 생산 물량 전체가 이미 완판됐다"고 밝혔고, 마이크론 CEO도 동일한 입장을 공개적으로 밝혔습니다.
공급 부족 규모는 수요 대비 50~60% 수준으로 추산됩니다. HBM 가격은 2025년에만 246% 상승했고, 이 영향은 AI 클라우드 서비스 가격과 소비자 GPU 공급에도 미치고 있습니다.
HBM4, 이번엔 무엇이 달라졌나요
HBM4는 단순히 더 빠른 버전이 아닙니다.
핀당 데이터 속도는 오히려 HBM3E(9.8Gb/s)보다 낮은 8Gb/s로 내려갔어요. 대신 버스 폭이 1024비트에서 2048비트로 두 배가 됐습니다. '더 빠르게'가 아니라 '더 넓게' — 한 번에 더 많은 데이터를 동시에 주고받는 방향으로 설계 철학이 바뀐 거예요.
스택당 대역폭이 2TB/s를 넘기고, 스택당 최대 용량도 64GB로 올라갑니다. HBM3E 대비 60% 성능 향상, 40% 전력 효율 개선 효과가 예상됩니다.
SK하이닉스는 젠슨 황이 직접 최태원 회장에게 "출하 시점을 6개월 앞당겨달라"고 요청한 것으로 알려졌고, 엔비디아 HBM4 물량의 약 70%를 SK하이닉스가 가져갈 것으로 보입니다.
| 구분 | 2025년 | 2026년 전망 | 2028년 전망 |
|---|---|---|---|
| HBM 시장 규모 | 약 350억 달러 | 약 546억 달러 (+58%) | 약 1,000억 달러 이상 |
| SK하이닉스 HBM 점유율 | 약 59% | 약 50~54% | 경쟁 심화 전망 |
| 주력 규격 | HBM3E | HBM3E + HBM4 | HBM4E / HBM5 |
HBM 반도체가 주목받을수록 한국 반도체 산업의 무게가 달라집니다
AI 시대에 '연산'은 엔비디아 중심으로 재편됐지만, '메모리'는 한국이 쥐고 있습니다.
SK하이닉스와 삼성전자가 글로벌 HBM 반도체 시장의 약 80% 이상을 점유하고 있어요. 한국산 HBM이 없으면 엔비디아도, 아마존도, 구글도 AI 데이터센터를 제대로 증설할 수 없는 구조입니다.
AI 모델이 커질수록 파라미터 수는 늘어나고, 파라미터가 늘어날수록 HBM 수요도 함께 올라가요. 공장을 짓는 데 2~3년이 걸리는 만큼, 공급은 당분간 수요를 따라가기 어렵습니다. SK하이닉스 최태원 회장은 "메모리 반도체 공급 부족이 2030년까지 이어질 수 있다"고 언급했어요.
HBM 반도체 뉴스를 볼 때, 이제 SK하이닉스·HBM·엔비디아 세 단어가 연결되는 이유가 조금 더 선명해지셨으면 합니다.