엔비디아, AI 추론 전용 신형 칩 공개 예고
||2026.03.02
||2026.03.02
엔비디아가 인공지능(AI) 처리 속도를 대폭 끌어올릴 새로운 프로세서를 공개할 계획이다. 챗GPT 개발사 오픈AI를 비롯한 주요 고객사들이 보다 빠르고 효율적인 AI 서비스를 구축할 수 있도록 설계된 칩으로, 기존 그래픽처리장치(GPU) 중심 구조에 추론 특화 연산을 결합하는 방향의 전략 전환을 예고하고 있다.
2월 27일(현지시각) 월스트리트저널에 따르면 엔비디아가 ‘추론(inference)’ 연산에 특화된 새로운 시스템을 개발 중이라고 복수의 관계자를 인용해 보도했다.
추론은 학습을 마친 AI 모델이 실제 사용자 질의에 답을 생성하는 과정으로, 최근 AI 산업의 무게 중심이 빠르게 이동하고 있는 영역이다. 신형 플랫폼은 3월 미국 새너제이에서 열리는 엔비디아의 GTC 개발자 콘퍼런스에서 공개될 예정이다.
특히 이번 시스템에는 스타트업 그록이 설계한 칩이 포함될 것으로 전해졌다. 엔비디아는 지난해 말 그록의 핵심 기술을 라이선스하고 경영진을 영입하는 대형 ‘인수형 채용(acqui-hire)’ 계약을 체결한 바 있다. 그동안 GPU 중심 전략을 고수하던 것에서 외부 기술을 결합해 추론 성능을 끌어올리는 방향으로 선회하는 셈이다.
현재 추론용 반도체 시장은 경쟁이 격화되고 있다. 구글과 아마존은 자체 설계 칩으로 엔비디아의 주력 시스템에 도전장을 내밀었다. 기술 업계에서 자율 코딩과 AI 에이전트 활용이 급증하면서, 복잡한 AI 작업을 보다 효율적으로 처리할 수 있는 전용 칩 수요도 빠르게 늘고 있다.
엔비디아는 그동안 GPU 시장의 90% 이상을 점유하며 ‘호퍼(Hopper)’, ‘블랙웰(Blackwell)’ 등 고성능 제품으로 AI 학습 시장을 장악해왔다. 그러나 일부 기업들은 GPU가 추론 단계에서는 비용이 높고 전력 소모가 크다는 점을 지적해왔다.
오픈AI는 이번 신형 프로세서의 주요 고객 중 하나가 될 전망이다. 오픈AI는 최근 수개월간 보다 효율적인 추론 칩을 모색하며 세레브라스 시스템즈(Cerebras)와도 대규모 계약을 체결했다. 동시에 엔비디아로부터 ‘전용 추론 용량’을 대거 확보하기로 하면서 협력 관계를 유지하고 있다.
엔비디아는 최근 메타플랫폼과의 협력 확대를 통해 일부 AI 업무를 GPU가 아닌 CPU 중심으로 운영하는 방안도 제시했다. 이는 GPU 일변도 전략에서 벗어나 AI 시장의 다양한 수요를 흡수하려는 움직임으로 해석된다.
한재희 기자
onej@chosunbiz.com


1
2
3
4
5