
영상 링크: The Geopolitics of AI Infrastructure - Dylan Patel, SemiAnalysis
채널명: AI Engineer
AI 인프라의 지정학: Dylan Patel, SemiAnalysis 핵심 요약
- 화웨이는 자체 AI 칩 Ascend 910B/C와 초대형 시스템(Cloud Matrix 384)을 개발, 12개 랙에 384개 칩을 광학적 네트워크로 연결해 높은 확장성과 대역폭을 실현함
- 엔비디아도 유사한 구조(DGX H100 Ranger)를 시도했으나, 고비용·전력소모·신뢰성 문제로 상용화에 실패했고, 화웨이는 이를 극복함
- 미국의 제재에도 불구하고, 화웨이 칩은 TSMC, 삼성·하이닉스 HBM 메모리, 미국·네덜란드·일본 패키징 장비 등 글로벌 공급망을 우회해 생산됨
- 삼성 HBM 메모리는 코아시아와 파라데이 등 중간 회사를 거쳐, 규제 회피 방식으로 실제 사용 가능하게 중국에 유입됨
- 화웨이는 이미 약 2.9~3백만 개의 AI 칩과 1,300만 개 이상의 HBM 스택을 확보해 대규모 모델 학습이 가능한 컴퓨팅 자원을 보유함
- SMIC가 7nm 공정의 스마트폰 칩을 양산 중이며, 올 해부터 대형 AI 칩 대량생산 가능성도 있음—중국 내 자체 생산 확대가 예고됨
- 미국의 엔비디아 대중 수출 제한(H20, H100 등)은 수십억 달러 규모의 GPU 차단으로 이어졌으나, 그 효과엔 한계가 존재함
- 중동(UAE G42, 사우디 Data Volt 등)은 미·중을 뛰어넘는 초대형(최대 5기가와트) 데이터센터를 건설 중이며, 미국·AI 기업이 참여하는 복합 투자구조가 형성
- UAE G42에는 마이크로소프트가, 사우디 Data Volt는 2~20조 달러에 달하는 미국 데이터센터 투자와 다수의 미국 및 AI 기업과 협력
- 데이터센터 전력 문제로 미국 내 AI 인프라 확대가 제한되는 반면, 중동과 중국은 막대한 전력·인프라 능력을 바탕으로 AI 지정학 경쟁에서 빠르게 추격 중임
세부 요약 - 주제별 정리
화웨이는 초대형 AI 연산시스템(Cloud Matrix 384) 개발로 엔비디아가 실패한 구조적 한계를 극복함
- 화웨이는 Ascend 910B, 910C 칩을 기반으로 384개 칩을 연결한 ‘Cloud Matrix 384’라는 대형 AI 시스템을 설계
- 이 시스템은 12개 랙에 384개 칩을 광학적 네트워크로 초고대역폭으로 연결함
- 유사하게 엔비디아는 DGX H100 Ranger(256개 GPU, NVLink, 광학 연결)를 시도했으나 비용, 전력, 신뢰성 한계로 제품화에 실패
- 엔비디아는 결국 120kW의 블랙웰(BW NVL72) 등구리 케이블 기반 아키텍처로 방향을 선회함
- 광학 인터커넥트는 더 비싸고 신뢰성 이슈가 있지만, 화웨이는 낮은 제조원가와 엔지니어링으로 해당 한계를 실질적으로 극복
글로벌 공급망 우회를 통해 화웨이는 미국 주도의 규제를 무력화하며 생산을 이어감
- 미국의 강력한 대중국 반도체 제재에도 화웨이 칩은 TSMC에서 제조됨
- 화웨이는 Sofco(가짜로 분리된 비트코인 채굴회사)를 이용해 TSMC 생산량(약 2.9~3백만 개 칩 상당)을 확보
- 삼성, 하이닉스의 HBM 메모리도 코아시아(타이완), 파라데이 등 중계회사를 거쳐, 용도 위장 칩에 실어 중국에 반입 후 실제 Ascend 칩에 재조립
- 패키징, 테스트 관련 장비 역시 미국, 네덜란드, 일본 등에서 수입됨
- 이 과정 전체가 규정상 합법이거나, 실질적으로 제재를 우회하도록 설계됨
화웨이는 1,300만 개 이상의 HBM을 비축해 대규모 AI 학습에 필요한 컴퓨팅 파워를 확보함
- 삼성을 통한 HBM 공급은 중간 가짜 칩을 거치는 절차적 우회 방식
- 해당 방식으로 화웨이는 약 1,300만 개 이상의 HBM 스택을 확보
- 실제 Ascend 칩에 다시 장착해 자체 AI 클러스터 구축
- 그 결과 중국은 제재 환경에서도 경쟁력 있는 학습 인프라를 지속 확장 가능
중국 SMIC는 7nm 스마트폰 칩 양산 경험을 토대로 AI 칩 대량생산 체제로 전환 중임
- SMIC는 현재 월 5만 개 웨이퍼(7nm) 생산 가능, 지금까지는 스마트폰 칩(소형, 높은 수율)만 생산
- 2020년, 아이폰이 5nm 칩을 상용화했던 것을 예로 들며, 실제 AI GPU는 약 2~3년 후에 상용화된 사례와 유사
- SMIC도 올해 내 AI용 7nm 칩 양산 전환 가능성이 높아, 수백만 단위 칩 생산력 확보 전망
- DeepSeek 등 중국 내 AI 기업이 화웨이 칩 활용해 차세대 모델 훈련을 공식 발표
미국의 엔비디아 GPU 수출 제한은 중국 AI 컴퓨팅 자원 확보에 한계적 방해만 제공함
- 최신 GPU인 H20(축소형 H100/H200) 등의 대중국 수출 금지
- 엔비디아는 약 50억 달러 재고 손실, 실제 금년 중국에 최대 500억 달러 매출 가능성을 언급(CFO Colette)
- 구체적으로 100만 개 이상의 GPU가 차단됐으나, 중국 내 자체 칩 확보와 우회 수입 등으로 수요 충족 가능
중동(UAE, 사우디)은 세계 최대 규모의 AI 데이터센터 캠퍼스를 국가적 프로젝트로 추진
- UAE의 G42는 위성사진상 5GW(기가와트) 캠퍼스 조성—세계 최대 AI 전용 시설
- 연간 50만 개 GPU 구매 가능, 20%는 UAE 내 자유롭게 사용, 80%는 미국 하이퍼스케일러/클라우드/AI기업에 배분
- 캠퍼스 중 Stargate의 첫 6개 동만 해도 1.2GW로 오픈AI, xAI(200MW 수준) 등과 비교해 6~10배 이상 규모
- G42의 대표적 투자 파트너는 마이크로소프트(Microsoft)로, UAE 내 투자액만큼 미국 내 투자도 동시 집행 조건
- 오픈AI, 마이크로소프트 모두 중동 내 AI 클러스터 활용 방안을 논의 중
사우디 아라비아의 Data Volt도 초대형 데이터센터와 연합 투자를 진행, 미국과의 경제 결합을 강화함
- Data Volt는 ‘The Line’(초장대 신개념 도시) 내 2GW급 데이터센터 추진, 이미 부지 공사 시작
- Data Volt와 협력하는 미국 측 투자는 200억 달러, 전체 미국-중동 AI 인프라 합산 투자액은 800억 달러 이상 전망
- Data Volt는 Humane(클라우드-네이티브 데이터센터 기업)과 긴밀 협력; Humane은 Qualcomm, AMD, Nvidia 등에서 맞춤형 프로세서 대량 구매
- Humane은 Aramco Digital과 연계, 이들이 Groq의 매출 대부분을 차지
- AWS 등 미국 기업도 대거 동참, 미-중동 공동투자 열풍을 이끔
중동-미국 AI 인프라 협력은 목표와 역할 분담, 그리고 보안 논란이 얽혀 있음
- 미국 내 AI 기업들은 충분한 자금·전력·인프라 부족으로 자체 대규모 데이터센터 구축에 한계
- 대신 중동 자본(G42, Data Volt 등)이 대규모 GPU와 인프라 선투자; 미국 기업은 장기 임대(5년 계약) 형태로 실질 비용/리스크 최소화
- 오픈AI-마이크로소프트 간 직접투자 갈등의 배경: 막대한 인프라 구축비(예: 1000억 달러)와 불확실한 장기 수익성
- 중동 투자자(G42/UAE·Data Volt/사우디)는 높은 위험을 감수—‘가장 ‘바보 같은’ 투자자’라 평가되기도 하지만, 실질적으로 AI 기업 성장을 견인
미국 내 AI 데이터센터 확장은 전력 공급 부족으로 구조적 한계를 겪고 있음
- 미국은 건설 중이거나 계획 발표된 데이터센터의 합산 전력수요가 현재 공급능력을 크게 초과
- 영상 내 자료: 미국은 당장 63GW(기가와트) 전력 부족 상태(2023년 기준)
- 44GW 신규발전소 가동해도, 100GW 이상 데이터센터 전력수요를 충족 못함—특히 재생에너지, 배터리, 천연가스, 석탄 발전 등 모든 낙관적 전제를 동원해도 부족
- 미국 내 유틸리티 기업은 구조적으로 비효율적(규제 독점)이고, 연방이 아닌 주/지역 단위의 복잡한 규제 탓에 인프라 신속 구축이 불가
- 실제로 데이터센터 건설 프로젝트 중 다수는 중도 좌초; 심지어 전력 부족으로 석탄 주식이 3배 상승한 사례도 존재
중국과 중동(특히 중국)은 강력한 전력·인프라 확장 능력으로 AI 경쟁에서 미국을 빠르게 추월 중임
- 중국은 지난 7년 간 미국 전체 전력망 규모만큼을 추가 설치(즉, 대규모 발전소·그리드 확장에 능함)
- 중국은 전력, 인프라, 칩 생산 모두에서 대외 제재 우회 및 내부 생산 역량 강화에 성공 중
- 중동의 G42/UAE, Data Volt/사우디 등은 전력 공급과 인프라 투자에 제약이 적어, 초대형 데이터센터를 조기에 완공 가능
AI 대규모 인프라 경쟁은 국경을 초월한 자본·기술 이동, 제재 우회, 리스크 분산 등의 전략 싸움으로 전개됨
- GPU·칩 설계, 생산, 메모리, 패키징 등 각 밸류체인 내 공급망 우회·우연합 방식 활발
- 규제·수출 제한은 현실적으로 진행 중인(또는 계획 중인) 우회·편법 앞에 한계가 드러남
- AI 인프라는 국경, 법률, 지정학을 넘어 대규모 자본, 리스크와 결합해 신속하게 이동/구축되고 있음
SMIC 및 기타 중국 장비기업은 자가 기술력 강화로 장기적으로 TSMC와의 격차를 줄이고 있음
- SMIC는 현재 장비 대부분(미국, 일본, 네덜란드)을 외국에서 구매하나, 자국산 장비와 함께 혼합 운용
- 이 과정에서 수입 장비 해체·역설계를 통한 내재화 시도 병행
- 궁극적으로 대외의존도 감소, 기술력 추격을 통한 ‘자력갱생’ 전략을 강화