posts / 과학

AI 시대의 숨은 주역, NPU: 뇌를 닮은 반도체, 글로벌 거인들과 한국의 도전자들

phoue

19 min read --

AI의 심장을 뛰게 할 새로운 두뇌, NPU의 등장

CPU, GPU는 알겠는데, NPU는 누구?

우리는 컴퓨터의 ‘두뇌’에 대해 이야기할 때 흔히 **CPU(중앙처리장치)**를 떠올립니다. 그리고 화려한 그래픽을 처리하는 데에는 **GPU(그래픽처리장치)**가 필수적이라는 것도 잘 알고 있죠. 그런데 최근 AI 시대가 본격화되면서 ‘NPU’라는 이름이 점점 더 자주 들려오고 있습니다. CPU, GPU와는 또 다른 이 새로운 처리 장치는 과연 무엇일까요?

NPU는 ‘신경망 처리 장치(Neural Processing Unit)’의 약자로, 이름에서 알 수 있듯 **인공지능(AI)**과 딥러닝 알고리즘을 실행하기 위해 태어난 전용 하드웨어입니다. 그 역할을 이해하기 위해 하나의 사무실 팀을 상상해 보면 쉽습니다.

  • CPU (Central Processing Unit): 이 팀의 유능한 ‘팀장’입니다. 복잡하고 다양한 지시를 순서대로 처리하는 데 능숙하죠. 컴퓨터 운영체제를 관리하고, 여러 작업의 우선순위를 정하는 등 핵심적인 지휘 역할을 수행합니다. 하지만 수천, 수만 개의 단순 반복 작업을 동시에 처리하라고 하면 버거워합니다.
  • GPU (Graphics Processing Unit): 원래는 그래픽 처리를 위해 고용된 ‘대규모 작업팀’입니다. 수천 개의 코어가 단순 계산을 동시에 병렬로 처리하는 데 특화되어 있습니다. 픽셀 하나하나를 계산해야 하는 그래픽 작업에 안성맞춤이었죠. 그런데 이 병렬 처리 능력이 AI가 요구하는 대규모 행렬 곱셈 연산과 비슷하다는 점이 발견되면서, AI 연산을 위한 핵심 인력으로 차출되었습니다.
  • NPU (Neural Processing Unit): 이 팀에 새로 합류한 ‘AI 전문 분석가’입니다. 다른 범용적인 일은 하지 않습니다. 오직 AI의 신경망 계산이라는 한 가지 임무에만 모든 역량을 집중하도록 설계되었습니다. 특정 목적을 위해 태어났기 때문에, AI 작업에 있어서는 팀장(CPU)이나 대규모 작업팀(GPU)보다 훨씬 빠르고 효율적으로 일을 처리합니다.

CPU가 순차적 작업을 처리하는 팀장이라면, GPU는 대규모 병렬 작업을, NPU는 AI 연산만을 전문으로 처리하는 분석가에 비유할 수 있습니다.
CPU가 순차적 작업을 처리하는 팀장이라면, GPU는 대규모 병렬 작업을, NPU는 AI 연산만을 전문으로 처리하는 분석가에 비유할 수 있습니다.

기존의 두뇌로는 부족했던 이유

그렇다면 왜 우리는 GPU라는 강력한 작업팀만으로는 만족할 수 없었을까요? AI 시대의 도래는 우리가 처리해야 할 데이터의 종류와 양을 근본적으로 바꿔놓았습니다. 과거의 데이터가 주로 텍스트 위주였다면, 지금은 이미지와 영상 데이터가 홍수처럼 쏟아지고 있습니다. 이러한 대용량 데이터를 실시간으로 분석하고 판단해야 하는 AI 애플리케이션이 급증했습니다.

딥러닝 알고리즘의 핵심은 수많은 행렬 곱셈과 컨볼루션(Convolution) 같은 연산을 동시에, 그리고 반복적으로 수행하는 것입니다. GPU는 병렬 처리 능력 덕분에 CPU보다 이 작업을 훨씬 잘 해냈지만, 근본적인 한계가 있었습니다. GPU는 태생적으로 그래픽 처리를 위해 설계된 범용 칩이었기 때문에, AI 연산만을 위한 최적의 구조는 아니었습니다. 이는 두 가지 큰 문제로 이어졌습니다.

첫째, 엄청난 전력 소모입니다. AI 모델을 학습시키고 운영하는 데이터센터는 GPU를 수천, 수만 개씩 사용하는데, 이로 인한 전력 소비와 발열은 상상을 초월합니다. ‘전기 먹는 하마’라는 별명이 붙을 정도였죠. 이는 데이터센터 운영 비용의 급증으로 이어졌습니다. 둘째, 스마트폰이나 IoT 기기 같은 배터리로 구동되는 소형 기기에는 GPU를 그대로 탑재하기 어려웠습니다. 높은 전력 소모와 발열 문제 때문입니다.

결국 AI 시대가 요구하는 것은 단순히 빠른 연산 속도만이 아니었습니다. 더 적은 에너지로 더 많은 연산을 처리하는 ‘전성비(성능 대비 전력 효율)’가 핵심 과제로 떠올랐습니다. 이는 단순한 기술적 성능 개선의 문제를 넘어, AI 기술의 지속 가능성과 경제성에 직결되는 문제였습니다. AI를 데이터센터의 특권에서 우리 손안의 기기까지 확장하기 위해서는 새로운 접근이 필요했습니다.

뇌를 닮은 프로세서의 탄생

이러한 시대적 요구에 대한 해답이 바로 NPU였습니다. NPU의 가장 큰 특징은 인간의 뇌가 작동하는 방식, 즉 신경망 구조를 하드웨어로 모방했다는 점입니다. 인간의 뇌는 수많은 신경세포(뉴런)와 그 연결고리(시냅스)를 통해 정보를 병렬적으로 동시에 처리합니다. NPU는 이러한 구조를 본떠, AI 연산의 핵심인 행렬 곱셈과 같은 작업을 수많은 작은 처리 장치에서 동시에 수행하도록 설계되었습니다.

이러한 ‘뇌를 닮은’ 구조 덕분에 NPUAI 연산에 있어서 GPU보다 훨씬 높은 효율을 자랑합니다. 불필요한 기능을 덜어내고 오직 AI 연산에만 집중하기 때문에, 같은 작업을 하더라도 훨씬 적은 전력을 소모하면서 더 빠른 속도를 낼 수 있습니다.

이러한 특성은 NPU의 활용 분야를 폭발적으로 넓혔습니다. 스마트폰에서 실시간으로 얼굴을 인식하고, 사진 속 피사체를 구분하며, 음성을 텍스트로 변환하는 등의 온디바이스(On-device) AI 기능NPU 덕분에 가능해졌습니다. 또한, 데이터센터에서는 거대언어모델(LLM)의 응답을 생성하는 ‘추론’ 과정에서 GPU보다 비용 효율적인 대안으로 각광받고 있으며, 자율주행차에서는 주변 환경을 실시간으로 인지하고 판단하는 핵심 두뇌 역할을 수행합니다.

Advertisement

결론적으로 NPU의 등장은 AI 하드웨어 패러다임의 전환을 의미합니다. ‘어떻게든 빠르게’를 외치던 시대에서 ‘얼마나 효율적으로 빠르게’를 고민하는 시대로의 전환이며, 이는 AI 기술이 데이터센터를 넘어 우리 일상 속 모든 기기로 스며드는 것을 가능하게 하는 핵심 동력입니다.

AI 반도체 전쟁의 서막: 글로벌 빅테크들의 NPU 전략

AI라는 거대한 시장을 선점하기 위한 글로벌 빅테크들의 경쟁은 이제 하드웨어, 특히 NPU를 중심으로 한 ‘칩 전쟁’으로 번지고 있습니다. 이 전쟁은 단순히 더 빠른 칩을 만드는 경쟁이 아닙니다. 각 기업은 자신들의 강점과 비전에 맞춰 각기 다른 전략적 영토를 구축하며 다각적인 전선을 형성하고 있습니다. 엔비디아, 구글, 애플이라는 세 거인의 움직임을 통해 이 전쟁의 양상을 자세히 들여다보겠습니다.

황제의 수성(守城): 엔비디아의 GPU 제국과 소프트웨어 해자

AI 칩 시장의 절대 강자를 꼽으라면 단연 엔비디아입니다. 엔비디아AI 학습에 사용되는 데이터센터용 GPU 시장의 80%에서 90%를 장악하며 독점적인 제국을 구축했습니다. 블랙웰(Blackwell)과 같은 최신 아키텍처를 통해 경쟁자들이 따라오기 힘든 압도적인 성능을 자랑하죠.

엔비디아의 진정한 힘은 하드웨어를 넘어, 15년 이상 축적된 ‘쿠다(CUDA)‘라는 강력한 소프트웨어 생태계에서 나옵니다.
엔비디아의 진정한 힘은 하드웨어를 넘어, 15년 이상 축적된 '쿠다\(CUDA\)'라는 강력한 소프트웨어 생태계에서 나옵니다.

하지만 엔비디아의 진정한 힘은 하드웨어 자체에만 있지 않습니다. 그들의 제국을 굳건히 지키는 것은 바로 ‘쿠다(CUDA)’라는 이름의 깊고 넓은 **소프트웨어 해자(Moat)**입니다. CUDA는 2007년에 처음 소개된 엔비디아의 병렬 컴퓨팅 플랫폼이자 프로그래밍 모델입니다. 개발자들은 CUDA를 통해 엔비디아 GPU의 성능을 최대한 활용하여 AI 모델을 개발할 수 있습니다. 지난 15년 이상 축적된 CUDA 생태계는 방대한 라이브러리, 최적화된 도구, 그리고 수많은 개발자 커뮤니티를 포함합니다. 이 때문에 AI 개발자들은 다른 회사의 칩으로 쉽게 넘어가지 못합니다. 새로운 하드웨어에 맞춰 모든 소프트웨어와 코드를 다시 개발하는 것은 엄청난 비용과 시간을 요구하기 때문이죠. 이것이 바로 경쟁사들이 엔비디아를 넘어서기 가장 어려워하는 지점입니다.

엔비디아는 여기에 만족하지 않고, 단순한 칩 제조사를 넘어 ‘풀스택(Full-stack) AI 플랫폼 기업’으로의 진화를 꾀하고 있습니다. 가상 세계에서 AI를 훈련하고 시뮬레이션할 수 있는 ‘옴니버스(Omniverse)’ 플랫폼, 대화형 AI 개발을 위한 ‘니모(NeMo)’ 프레임워크, 심지어 수만 개의 GPU가 탑재된 데이터센터 랙 전체를 시스템으로 판매하는 전략까지 펼치고 있습니다. 그들의 비전은 이제 ‘물리 AI(Physical AI)’와 ‘에이전트 AI(Agentic AI)’로 향하고 있습니다. 이는 로봇, 자율주행차 등 현실 세계와 상호작용하는 AI를 구현하는 것으로, AI의 적용 범위를 디지털 세계 너머로 확장하려는 야심찬 계획입니다.

도전자의 기습: 구글의 TPU와 ‘추론’ 시장 공략

엔비디아의 제국에 맞서는 가장 강력한 도전자 중 하나는 구글입니다. 구글은 검색, 포토, 번역 등 자사의 방대한 AI 서비스를 운영하면서 천문학적인 양의 연산을 처리해야 했습니다. 엔비디아 GPU에 전적으로 의존하는 것은 비용과 효율성 측면에서 큰 부담이었습니다. 그래서 구글은 자신들만의 비밀 병기를 직접 만들기로 결정합니다. 바로 ‘텐서 처리 장치(Tensor Processing Unit, TPU)’입니다.

구글은 자사 서비스에 최적화된 TPU를 통해 ‘추론’ 시장에서 엔비디아와 다른 길을 걷고 있습니다.
구글은 자사 서비스에 최적화된 TPU를 통해 '추론' 시장에서 엔비디아와 다른 길을 걷고 있습니다.

TPU는 2015년경, 구글 내부에서 자사의 AI 프레임워크인 ‘텐서플로(TensorFlow)’에 최적화된 형태로 탄생했습니다. 이세돌 9단과 대결했던 알파고의 ‘추론’ 과정에도 TPU가 활용되었죠. TPU의 가장 큰 특징은 AI 모델을 만드는 ‘학습(Training)’ 단계보다, 이미 만들어진 모델을 활용해 결과를 도출하는 ‘추론(Inference)’ 단계에 극도로 최적화되어 있다는 점입니다.

AI 시장을 자동차 경주에 비유한다면, ‘학습’은 최고의 성능을 내기 위해 차를 설계하고 튜닝하는 과정이고, ‘추론’은 완성된 차로 실제 트랙을 계속해서 달리는 과정입니다. 엔비디아 GPU가 튜닝 과정에서 압도적인 성능을 보인다면, 구글 TPU는 실제 주행에서 최고의 연비와 효율을 내는 ‘하이퍼-최적화 로켓’과 같습니다.

Advertisement

구글 TPU는 세대를 거듭하며 진화했습니다. 최근에는 6세대 ‘트릴리움(Trillium)’에 이어, 추론 성능을 극대화한 7세대 ‘아이언우드(Ironwood)’를 공개하며 기술력을 과시하고 있습니다. 아이언우드는 이전 세대 대비 와트당 성능(전성비)을 2배나 개선하는 등, 추론 시장에서의 지배력을 강화하려는 구글의 전략을 명확히 보여줍니다. 구글엔비디아가 장악한 ‘학습’ 시장을 정면으로 공격하기보다, 앞으로 훨씬 더 커질 ‘추론’ 시장을 공략하는 측면 공격 전략을 통해 AI 칩 전쟁의 판도를 바꾸려 하고 있습니다.

온디바이스의 제왕: 애플의 뉴럴 엔진과 프라이버시 요새

애플의 전략은 데이터센터가 아닌, 바로 우리 손안에 있는 기기에 초점을 맞춥니다. 그들의 목표는 클라우드에 의존하지 않고도 강력한 AI 경험을 제공하며, 동시에 사용자의 프라이버시를 철저히 보호하는 것입니다. 이 전략의 핵심에 바로 ‘애플 뉴럴 엔진(Apple Neural Engine, ANE)’이 있습니다.

애플은 M시리즈 칩에 탑재된 뉴럴 엔진(ANE)을 통해 강력한 온디바이스 AI와 프라이버시 보호를 동시에 추구합니다.
애플은 M시리즈 칩에 탑재된 뉴럴 엔진\(ANE\)을 통해 강력한 온디바이스 AI와 프라이버시 보호를 동시에 추구합니다.

ANE는 2017년 아이폰 X에 탑재된 A11 바이오닉 칩에 처음 등장했습니다. 이후 모든 아이폰, 아이패드, 그리고 M 시리즈 칩이 탑재된 맥에 이르기까지 애플 생태계의 핵심 부품으로 자리 잡았습니다.

ANE의 성능 발전은 경이로운 수준입니다. 2017년 A11 칩의 ANE는 초당 6천억 번(0.6 TOPS)의 연산을 수행했지만, 2020년 M1 칩에서는 11 TOPS, 2023년 M3 칩에서는 18 TOPS, 그리고 2024년 최신 M4 칩에서는 무려 38 TOPS의 연산 능력을 갖추게 되었습니다. 이는 불과 7년 만에 성능이 60배 이상 향상된 것입니다.

애플이 이처럼 ANE 성능 향상에 집착하는 이유는 명확합니다. 모든 AI 연산을 기기 내부에서 처리하는 ‘온디바이스 AI’를 통해 최고의 사용자 경험과 프라이버시를 동시에 달성하기 위함입니다. 민감한 개인 정보를 외부 서버로 보내지 않기 때문에 보안에 강력하고, 네트워크 연결 없이도 빠르고 안정적으로 작동합니다. 우리가 일상적으로 사용하는 애플 기기의 놀라운 기능들 뒤에는 ANE가 있습니다.

  • 보안과 인증: 얼굴을 3D로 인식해 잠금을 해제하는 ‘페이스 ID(Face ID)’.
  • 카메라: 역광에서도 인물과 배경의 디테일을 살리는 ‘스마트 HDR’, 어두운 곳에서도 밝고 선명한 사진을 찍는 ‘야간 모드’.
  • 생산성: 사진 속 글자를 인식해 복사할 수 있는 ‘라이브 텍스트(Live Text)’, 실시간 통화 통역.
  • AI 비서: 인터넷 연결 없이도 작동하는 ‘시리(Siri)’와 최근 발표된 ‘애플 인텔리전스(Apple Intelligence)’.

애플은 ‘코어 ML(Core ML)’이라는 프레임워크를 통해 개발자들이 ANE의 강력한 성능을 자신들의 앱에 쉽게 활용할 수 있도록 지원하며, 자신들만의 견고한 온디바이스 AI 생태계를 구축하고 있습니다.

이처럼 글로벌 AI 칩 전쟁은 단일 전선이 아닌, **데이터센터 학습(엔비디아), 데이터센터 추론(구글), 온디바이스 경험(애플)**이라는 세 개의 주요 전선에서 각기 다른 방식으로 전개되고 있습니다. 이러한 시장의 분화는 후발 주자인 한국 기업들에게 중요한 기회의 창을 열어주고 있습니다.

글로벌 AI 칩 거인들: 전략 비교

기업대표 칩/아키텍처핵심 전략적 우위
엔비디아Blackwell GPUCUDA 소프트웨어 생태계 & 풀스택 플랫폼
구글Ironwood TPU자사 서비스(검색, 제미나이)를 위한 극도의 효율성, 구글 클라우드 통합
애플M4 뉴럴 엔진하드웨어/소프트웨어 통합, 프라이버시, 전력 효율

엔비디아의 아성에 대한 가장 큰 위협은 아이러니하게도 더 나은 칩이 아니라, 그들의 가장 큰 고객들이 직접 칩 개발에 나서는 현상입니다. 구글, 아마존, 마이크로소프트, 메타와 같은 하이퍼스케일러들은 비싼 엔비디아 GPU에 대한 의존도를 줄이고, 자신들의 서비스에 완벽하게 최적화된 맞춤형 **NPU(ASIC)**를 개발하고 있습니다. 이는 NPU의 근본적인 가치, 즉 특정 목적에 최적화된 하드웨어가 범용 하드웨어보다 효율적이라는 명제를 스스로 증명하는 현상이며, AI 하드웨어 시장의 미래가 다각화될 것임을 시사합니다.

Advertisement

‘엔비디아 아성’에 도전하는 K-반도체: 대한민국 NPU 개발 현주소

글로벌 빅테크들이 각자의 전략으로 AI 반도체 영토를 확장하는 가운데, 대한민국 반도체 산업 역시 이 거대한 흐름에 도전장을 내밀고 있습니다. 메모리 반도체 세계 최강국이라는 타이틀에 안주하지 않고, 시스템 반도체의 꽃이라 불리는 AI 반도체 시장에서 새로운 성장 동력을 찾기 위한 움직임이 활발합니다. 한국의 전략은 엔비디아의 심장부를 직접 공격하기보다, 데이터센터 ‘추론’ 시장과 ‘온디바이스 엣지’ 시장이라는 양쪽 측면을 파고드는 영리한 ‘협공(pincer movement)’의 형태를 띠고 있습니다. 삼성, SK와 같은 거대 기업부터 대규모 투자를 유치한 스타트업까지, K-반도체 NPU 드림팀의 현주소를 자세히 살펴보겠습니다.

거인들의 양동작전: 삼성전자와 SK하이닉스

삼성의 온디바이스 강자: 엑시노스 NPU

삼성전자는 오랜 기간 자체 모바일 AP(Application Processor)인 ‘엑시노스(Exynos)’ 시리즈를 개발해왔습니다. 이 경험을 바탕으로 일찍부터 모바일 기기 내에서 AI 연산을 처리하는 NPU 개발에 집중했습니다. 그 시작은 2018년 공개된 ‘엑시노스 9820’으로, 이 칩에 탑재된 NPU는 이전 세대 대비 AI 연산 능력을 무려 7배나 향상시키며 온디바이스 AI 시대의 서막을 알렸습니다.

그리고 최근, 삼성 NPU 기술력의 정점을 보여준 것이 바로 ‘엑시노스 2400’입니다. 갤럭시 S24 시리즈에 탑재된 이 칩은 이전 모델(엑시노스 2200) 대비 NPU 성능이 약 14.7배나 향상되는 경이적인 발전을 이뤄냈습니다. 이 강력한 NPU 성능은 곧바로 소비자가 체감할 수 있는 기능으로 이어졌습니다. 갤럭시 S24 시리즈가 대대적으로 내세운 ‘갤럭시 AI’의 핵심 기능들, 예를 들어 인터넷 연결 없이도 실시간으로 통화를 통역해주거나, 텍스트 설명만으로 이미지를 생성하는 기능들이 바로 이 엑시노스 2400의 NPU 덕분에 가능해진 것입니다. 이는 NPU 기술이 어떻게 플래그십 제품의 핵심 경쟁력으로 자리 잡는지를 보여주는 가장 구체적인 사례입니다.

SK의 전략적 선회: 사피온에서 리벨리온 연합군으로

SK그룹 역시 AI 반도체 시장에 일찌감치 뛰어들었습니다. SK텔레콤의 자회사로 출발한 ‘사피온(SAPEON)’은 데이터센터 추론용 NPU 개발에 집중했습니다. 2020년 국내 최초 데이터센터용 AI 칩X220’을 선보였고, 이후 성능을 대폭 개선한 ‘X330’을 출시했습니다. X330은 전작 대비 4배 이상의 연산 성능2배 이상의 전력 효율을 달성했으며, 엔비디아의 중급 추론 카드인 L40S를 경쟁 상대로 지목할 만큼 기술력을 인정받았습니다. 또한, 글로벌 서버 제조사인 슈퍼마이크로(Supermicro)의 서버에 탑재 가능한 반도체로 검증받으며 상용화 가능성을 높였습니다.

하지만 SK는 더 큰 그림을 그렸습니다. 국내 AI 반도체 스타트업 간의 과도한 경쟁을 지양하고, 글로벌 시장에서 경쟁할 수 있는 ‘국가대표급’ 기업을 만들자는 결단을 내린 것입니다. 2024년, SK사피온을 또 다른 NPU 강자인 ‘리벨리온’과 합병한다고 발표했습니다. 이는 흩어져 있던 기술력과 자원을 하나로 모아 엔비디아에 대항할 연합군을 결성한, 한국 AI 반도체 역사에 한 획을 긋는 전략적 선택이었습니다.

두려움 없는 도전자들: 대한민국의 팹리스 3인방

한국 NPU 생태계의 또 다른 축은 바로 혁신적인 기술력으로 무장한 팹리스(Fabless, 반도체 설계 전문) 스타트업들입니다. 이들은 대기업의 든든한 지원과 투자를 바탕으로 각자의 영역에서 놀라운 성과를 만들어내고 있습니다.

리벨리온, 퓨리오사AI, 딥엑스와 같은 스타트업들이 ‘K-반도체’의 미래를 이끌고 있습니다.
리벨리온, 퓨리오사AI, 딥엑스와 같은 스타트업들이 'K-반도체'의 미래를 이끌고 있습니다.

리벨리온: 거대 투자를 등에 업은 라이징 스타

**리벨리온(Rebellions)**은 창업 3년여 만에 누적 투자금 2,800억 원을 유치하며 시장의 기대를 한 몸에 받고 있는 스타트업입니다. 이들의 주력 제품은 데이터센터 추론용 NPU인 ‘아톰(ATOM)’입니다. 리벨리온의 가장 큰 성과는 ‘아톰’을 실제 상용 서비스에 성공적으로 적용했다는 점입니다. KT는 리벨리온의 전략적 투자자이자 핵심 파트너로서, 자사의 클라우드 데이터센터에 아톰을 도입해 국내 최초로 국산 NPU 기반 클라우드 서비스를 상용화했습니다. KT의 초거대 AI 모델 ‘믿음(Mi:dm)’의 경량화 버전에도 아톰이 활용되는 등, 국산 NPU가 실제 AI 서비스의 두뇌 역할을 할 수 있음을 증명했습니다. 리벨리온의 다음 목표는 더 큰 시장입니다. 현재 삼성전자와 손잡고 차세대 AI 반도체리벨(REBEL)’을 공동 개발하고 있습니다. 이 칩은 챗GPT와 같은 거대언어모델(LLM) 시장을 직접 겨냥하는 고성능 칩으로, 리벨리온의 글로벌 시장 진출을 위한 핵심 무기가 될 것입니다.

퓨리오사AI: 성능으로 승부하는 기술 중심의 도전자

**퓨리오사AI(FuriosaAI)**는 압도적인 성능과 효율을 앞세워 엔비디아에 도전하는 또 다른 NPU 강자입니다. 2017년 설립된 이 회사는 1세대 칩 ‘워보이(Warboy)’에 이어, 최근 2세대 칩 ‘레니게이드(Renegade)’를 통해 시장을 놀라게 했습니다. 레니게이드512 TOPS의 높은 연산 성능을 단 180W의 낮은 전력으로 구현해, 경쟁 GPU 대비 월등한 전력 효율을 자랑합니다. 이러한 기술력은 최근 페이스북의 모회사인 메타로부터 인수 제안을 받았으나 거절한 일화로도 잘 알려져 있습니다. 퓨리오사AI의 기술력을 입증한 결정적 계기는 LG AI연구원과의 파트너십입니다. LG는 자사의 초거대 AI 모델 ‘엑사원(Exaone)’을 구동하는 데 값비싼 엔비디아 GPU 대신 퓨리오사AI레니게이드를 도입하는 테스트를 진행했고, 유의미한 성능을 확인했습니다. 이는 국산 NPU가 대기업의 핵심 LLM 인프라에서 GPU를 대체할 수 있는 현실적인 대안임을 보여준 상징적인 사건입니다. 이 외에도 **AI 스타트업 업스테이지(Upstage)**의 OCR(광학 문자 인식) 솔루션에 칩을 공급하는 등 상용화 사례를 꾸준히 만들어가고 있습니다.

딥엑스: 엣지 AI 시장을 파고드는 틈새의 강자

리벨리온퓨리오사AI가 데이터센터 시장을 공략한다면, **딥엑스(DEEPX)**는 전혀 다른 시장, 즉 초저전력 ‘엣지(Edge) AI’ 시장의 강자를 꿈꿉니다. 엣지 AI란 스마트폰, 가전, 로봇, CCTV 등 네트워크 끝단에 있는 기기 자체에서 AI 연산을 처리하는 기술을 말합니다. 딥엑스의 핵심 경쟁력은 다양한 엣지 디바이스의 요구사항에 맞춰 최적화된 NPU 포트폴리오를 제공한다는 점입니다. 물리보안, 스마트 팩토리, 로봇, 스마트 모빌리티 등 각기 다른 응용 분야에 맞는 맞춤형 AI 반도체를 공급합니다. 또한, 단순히 칩만 판매하는 것이 아니라, 컴파일러, 런타임, SDK(소프트웨어 개발 키트) 등 AI 모델을 쉽게 개발하고 구동할 수 있는 ‘풀스택 소프트웨어’를 함께 제공하여 고객의 개발 편의성을 높이는 데 주력하고 있습니다. CES 2024에서 3개 부문 혁신상을 수상하며 세계적으로 기술력을 인정받은 딥엑스엣지 AI라는 특정 분야에서 독보적인 경쟁력을 구축하고 있습니다.

Advertisement

이처럼 한국의 NPU 개발은 대기업과 스타트업이 각자의 역할과 강점을 바탕으로 유기적인 생태계를 이루고 있습니다. 팹리스 스타트업이 혁신적인 설계를 하면, 삼성전자SK하이닉스가 파운드리(반도체 위탁생산)와 **HBM(고대역폭 메모리)**을 공급하고, KT나 LG 같은 대기업이 초기 시장을 열어주는 상생의 구조입니다. 이 독특한 ‘코리안 NPU 얼라이언스’는 엔비디아의 아성에 도전하는 가장 현실적이고 강력한 전략이 되고 있습니다.

대한민국 NPU 도전자들: 경쟁 구도

기업대표 제품주요 파트너 / 후원사
삼성 LSI엑시노스 2400삼성전자 MX사업부 (갤럭시)
리벨리온 (사피온 통합)아톰 / 리벨 / X330KT, SK텔레콤, 삼성전자, IBM
퓨리오사AI레니게이드LG, 업스테이지, 네이버
딥엑스DX-M1 & 포트폴리오다양한 산업 고객사

미래를 향한 경주: NPU 시장의 전망과 대한민국의 과제

AI 반도체 시장은 이제 막 폭발적인 성장의 서막을 열었습니다. 앞으로 펼쳐질 미래는 K-반도체에게는 거대한 기회이자 동시에 혹독한 시험대가 될 것입니다. 시장의 잠재력은 얼마나 크며, 이 치열한 경주에서 승리하기 위해 대한민국이 넘어야 할 과제는 무엇일지 전망해 봅니다.

수백조 원 규모의 기회: NPU 시장 전망

시장 분석 기관들은 AI 칩 시장의 미래를 매우 밝게 예측하고 있습니다. 글로벌 AI 칩 시장 규모는 2030년대 초반까지 수천억 달러 규모로 성장할 것으로 전망됩니다. 특히 NPU온디바이스 AI 시장은 연평균 20%에서 35%에 이르는 높은 성장률을 기록할 것으로 예상되는, 가장 뜨거운 격전지입니다.

이러한 성장은 스마트폰, PC를 넘어 자동차, 로봇, 의료기기, 스마트홈 등 우리 삶의 모든 영역에 AI가 스며들면서 가속화될 것입니다. 클라우드에 의존하지 않고 기기 자체에서 빠르고 안전하게 작동하는 AI에 대한 수요가 폭발적으로 증가하면서, 저전력 고효율 NPU의 중요성은 더욱 커질 수밖에 없습니다. 한국의 NPU 기업들이 공략하는 ‘추론’과 ‘엣지’ 시장이 바로 이 성장의 중심에 있습니다.

진짜 전쟁터: 하드웨어를 넘어 생태계 전쟁으로

하지만 미래 시장의 과실을 얻기 위해서는 단순히 성능 좋은 칩을 만드는 것만으로는 부족합니다. AI 반도체 전쟁의 본질은 하드웨어 스펙 경쟁이 아닌, ‘소프트웨어 생태계’ 전쟁이기 때문입니다. 이 점이 바로 엔비디아의 아성이 견고한 이유이자, 모든 후발 주자들이 겪는 가장 큰 어려움입니다.

앞서 언급했듯, 엔비디아의 CUDA 플랫폼은 15년 이상 축적된 소프트웨어 자산입니다. 전 세계 수많은 개발자가 CUDA 환경에 익숙해져 있으며, 이를 기반으로 만들어진 AI 모델과 애플리케이션이 셀 수 없이 많습니다. 아무리 성능이 뛰어난 NPU가 등장해도, 개발자들이 쉽고 편리하게 사용할 수 있는 **소프트웨어 도구(컴파일러, 라이브러리, SDK 등)**가 없다면 무용지물입니다. 개발자들은 새로운 하드웨어를 위해 기존의 모든 개발 과정을 처음부터 다시 배우고 싶어 하지 않습니다.

이것이 바로 모든 NPU 기업들자체적인 소프트웨어 스택 개발에 사활을 거는 이유입니다. 딥엑스가 채용 공고에서 컴파일러, 런타임 등 풀스택 소프트웨어 개발 인력을 강조하는 것이나, 리벨리온PyTorch, TensorFlow와 같은 표준 프레임워크와의 완벽한 호환성을 내세우는 것은 모두 이 생태계 전쟁에서 살아남기 위한 필사적인 노력입니다.

대한민국 정부 역시 이 문제의 중요성을 명확히 인지하고 있습니다. 과학기술정보통신부가 주도하는 ‘K-클라우드 프로젝트’는 이러한 현실에 대한 국가 차원의 전략적 대응입니다. 이 프로젝트는 2030년까지 총 4,000억 원이 넘는 예산을 투입하여, 국산 NPU를 기반으로 데이터센터의 하드웨어와 소프트웨어 인프라를 함께 개발하는 것을 목표로 합니다. 이는 단순히 개별 기업을 지원하는 것을 넘어, 국산 NPU가 원활하게 작동할 수 있는 거대한 소프트웨어 생태계, 즉 ‘한국형 CUDA’를 만들려는 시도입니다. 이 프로젝트의 성공 여부는 국내 NPU 산업의 미래를 좌우할 중요한 변수가 될 것입니다.

대한민국의 나아갈 길: 도전과 기회

K-반도체가 글로벌 NPU 시장의 주역으로 발돋움하기 위한 길은 결코 순탄치 않습니다. 하지만 명확한 기회 또한 존재합니다.

Advertisement

도전 과제
  1. 소프트웨어 격차: 엔비디아가 수십 년간 쌓아 올린 CUDA 생태계의 벽은 여전히 높습니다. 이를 따라잡기 위해서는 지속적이고 막대한 투자가 필요합니다.
  2. 규모와 자본: 국내 스타트업들의 연구개발(R&D) 투자 규모는 엔비디아의 1%에도 미치지 못하는 수준입니다. 글로벌 경쟁을 위해서는 지금보다 훨씬 더 큰 규모의 자본과 인재 확보가 절실합니다.
  3. 글로벌 고객 확보: 정부 프로젝트나 국내 대기업과의 협력을 넘어, 까다로운 글로벌 빅테크와 데이터센터 시장에 진입해 대규모 수주를 따내는 것이 생존과 성장의 최종 관문입니다.
기회 요인
  1. 틈새시장 선점: 엔비디아가 장악한 ‘학습’ 시장 대신, NPU가 구조적 강점을 가지는 ‘추론’과 ‘엣지’ 시장에 집중하는 전략은 매우 유효합니다. 이 시장에서 기술적 우위를 확보하고 시장 점유율을 넓혀나갈 수 있습니다.
  2. 국내 생태계 시너지: 세계 최고 수준의 메모리(HBM) 기술과 파운드리 인프라를 보유한 한국의 산업 구조NPU 팹리스 기업들에게는 더할 나위 없는 기회입니다. HBM 제조사인 SK하이닉스, 삼성전자NPU 설계 기업 간의 긴밀한 협력은 차세대 칩 개발에 있어 강력한 시너지를 낼 수 있습니다.
  3. 국가적 지원:K-클라우드’와 같은 정부의 강력한 지원 정책은 초기 시장 창출과 기술 개발 가속화에 중요한 역할을 할 수 있습니다.

궁극적으로 한국 NPU 기업들의 성공은 단순히 한 국가의 산업적 성공을 넘어, 전 세계 AI 산업에 중요한 의미를 가집니다. 현재 AI 산업엔비디아라는 단일 공급자에 대한 의존도가 지나치게 높다는 리스크를 안고 있습니다. 만약 한국의 리벨리온-사피온 연합군이나 퓨리오사AI 같은 기업들이 글로벌 데이터센터 시장에서 의미 있는 대안으로 자리 잡는다면, 이는 GPU 중심의 AI 하드웨어 시장이 NPU 중심으로 다각화될 수 있다는 강력한 신호가 될 것입니다.

이는 AI 인프라의 미래를 둘러싼 거대한 패러다임 전환의 시작을 의미하며, 대한민국의 도전자들은 바로 그 역사의 중심에 서 있습니다. 뇌를 닮은 반도체, NPU가 열어갈 새로운 AI 시대K-반도체가 어떤 역할을 하게 될지 전 세계가 주목하고 있습니다.


출처
#NPU#AI#반도체#AI 반도체#시스템 반도체#온디바이스 AI#CPU#GPU#신경망 처리 장치#K-반도체

Recommended for You

인텔, 삼성, SK가 참전한 '유리기판 전쟁', 미래 반도체의 승자는?

인텔, 삼성, SK가 참전한 '유리기판 전쟁', 미래 반도체의 승자는?

5 min read --
딥시크, 혁신의 탈을 쓴 감시자인가?

딥시크, 혁신의 탈을 쓴 감시자인가?

5 min read --
석유의 기원: 공룡의 눈물이라는 신화와 과학적 진실

석유의 기원: 공룡의 눈물이라는 신화와 과학적 진실

4 min read --

Advertisement

댓글