• 홈
  • 데일리카
  • 스마트모빌
  • 브랜드모빌
주식회사 패스트뷰
  • 회사소개
  • 개인정보처리방침
  • 청소년보호정책
  • 이메일무단수집거부
  • 사업자등록번호: 619-87-00936
  • 서울시 강남구 강남대로 364, 미왕빌딩 12층 (역삼동 826-21)
  • 대표 : 02-6205-0936팩스: 02-6205-0936대표메일: team@fastviewkorea.com
  • 네이트커뮤니케이션즈㈜는 정보제공업체 또는 정보제작업체가 제공한 상기의 정보와 관련하여 발생한 문제에 대해서 어떠한 책임도 부담하지 않으며, 모든 책임은 각 정보제공업체에게 있습니다.
  • © NATE Communications

KAIST, PC·모바일도 AI 인프라로...챗GPT 비용 낮춘다

데일리안|kjh@dailian.co.kr (김지현 기자)|2025.12.28

저렴한 소비자급 GPU 활용

LLM 인프라 비용 67% 절감

‘스펙엣지’로 AI 서비스 보편화 기대

(왼쪽부터) 박진우 KAIST 전기 및 전자공학부 박사, 조승근 석사과정, 한동수 교수.ⓒKAIST
(왼쪽부터) 박진우 KAIST 전기 및 전자공학부 박사, 조승근 석사과정, 한동수 교수.ⓒKAIST

한국과학기술원(KAIST) 연구진이 비싼 데이터센터 GPU를 덜 쓰고, 주변에 있는 저렴한 GPU를 활용해 AI 서비스를 더 싸게 제공할 수 있는 기술을 개발했다.

KAIST는 한동수 전기 및 전자공학부 교수 연구팀이 데이터센터 밖에 널리 보급된 저렴한 소비자급 GPU를 활용해 LLM 인프라 비용을 크게 낮출 수 있는 새로운 기술 ‘스펙엣지(SpecEdge)’를 개발했다고 28일 밝혔다.

SpecEdge는 데이터센터 GPU와 개인 PC나 소형 서버 등에 탑재된 엣지 GPU가 역할을 나눠 LLM 추론 인프라를 함께 구성하는 방식이다. 이 기술을 적용한 결과 기존 데이터센터 GPU만 사용하는 방식에 비해 토큰(AI가 문장을 만들어내는 최소 단위)당 비용을 약 67.6% 절감할 수 있었다.

연구팀은 이를 위해 추측적 디코딩(Speculative Decoding)이라는 방법을 활용했다. 엣지 GPU에 배치된 소형 언어모델이 확률이 높은 토큰 시퀀스를 빠르게 생성하면 데이터센터의 대규모 언어모델이 이를 일괄 검증하는 방식이다. 이 과정에서 엣지 GPU는 서버의 응답을 기다리지 않고 계속 단어를 만들어, LLM 추론 속도와 인프라 효율을 동시에 높였다.

데이터센터 GPU에서만 추측적 디코딩을 수행하는 방식과 비교해 비용 효율성은 1.91배, 서버 처리량은 2.22배 향상됐다. 특히 일반적인 인터넷 속도에서도 문제없이 작동해, 별도의 특수한 네트워크 환경 없이도 실제 서비스에 바로 적용할 수 있는 기술임을 확인했다.

또 서버는 여러 엣지 GPU의 검증 요청을 효율적으로 처리하도록 설계돼, GPU 유휴 시간 없이 더 많은 요청을 동시에 처리할 수 있다. 이를 통해 데이터센터 자원을 보다 효율적으로 활용할 수 있는 LLM 서빙 인프라 구조를 구현했다.

이번 연구는 데이터센터에 집중돼 있던 LLM 연산을 엣지로 분산시켜 AI 서비스의 기반이 되는 인프라 비용은 줄이고 접근성은 높일 수 있는 새로운 가능성을 제시했다.

향후 스마트폰, 개인용 컴퓨터, 신경망 처리장치(NPU) 등 다양한 엣지 기기로 확장될 경우, 고품질 AI 서비스가 보다 많은 사용자에게 제공될 수 있을 것으로 기대된다.

한 교수는 “데이터센터를 넘어 사용자의 주변에 있는 엣지 자원까지 LLM 인프라로 활용하는 것이 목표”라며 “이를 통해 AI 서비스 제공 비용을 낮추고, 누구나 고품질 AI를 활용할 수 있는 환경을 만들고자 한다”고 말했다.

연구에는 KAIST 박진우 박사와 조승근 석사과정이 참여했으며 연구 결과는 지난 2~7일 미국 샌디에이고에서 열린 AI 분야 최고 권위 국제 학회인 신경정보처리시스템 학회(NeurIPS)에서 스포트라이트(Spotlight)로 발표됐다.

©(주) 데일리안 무단전재 및 재배포 금지

  • 부푸는 천스닥 기대감…12월 코스닥 거래대금, 2년 4개월만 ‘최대’
  • 대한상의 "새해 기업경기 회복 더딜 듯…내수·중소기업 체감경기 정체"
  • 중기중앙회, 소기업·소상공인 전용 우대보증 지원 확대
  • 내년 상반기 스튜어드십 코드 개정 추진…주요 방향성은
  • "한·미·일 대표기업 중 성장·재무안정은 한국, 수익성은 미국이 앞서"

가격대별 인기 장기 렌트카

  • 20만원대
  • 30만원대
  • 40만원대
  • 50만원대
  • 60만원대
  • 더 뉴 캐스퍼

    현대 더 뉴 캐스퍼 2025년형 가솔린 1.0 2WD 디 에센셜 (자동)

    최저가233,670원~

  • 더 뉴 기아 레이(PE)

    기아 더 뉴 기아 레이(PE) 2025년형 가솔린 1.0 2WD 프레스티지 (자동)

    최저가220,250원~

장기렌트 인기TOP

  • 기아 더 뉴 쏘렌토(MQ4 F/L)1

    기아 더 뉴 쏘렌토(MQ4 F/L)

    월 258,200 ~

    신차 견적 빠른 상담
  • 현대 디 올-뉴 싼타페 HEV(MX5)2

    현대 디 올-뉴 싼타페 HEV(MX5)

    월 265,180 ~

    신차 견적 빠른 상담
  • 제네시스 GV70(JK F/L)3

    제네시스 GV70(JK F/L)

    월 387,110 ~

    신차 견적 빠른 상담
  • 기아 더 뉴 기아 레이(PE)4

    기아 더 뉴 기아 레이(PE)

    월 199,903 ~

    신차 견적 빠른 상담
  • 현대 더 뉴 투싼 HEV (NX4 F/L)5

    현대 더 뉴 투싼 HEV (NX4 F/L)

    월 236,650 ~

    신차 견적 빠른 상담