AI 에이전트가 부른 ‘토크노믹스’...기업 AI 비용관리 판 바꾼다
||2026.05.27
||2026.05.27
[디지털투데이 이진호 기자] 인공지능(AI) 에이전트 확산으로 기업 AI 비용 구조가 달라지고 있다. AI 활용 비용을 산정할 때 토큰 사용량과 업무 흐름을 함께 따지는 '토크노믹스(Tokenomics)' 관점에서 봐야 한다는 분석이 나온다.
토크노믹스는 AI가 처리하는 데이터 단위인 토큰과 경제학을 뜻하는 이코노믹스를 합친 말이다. 에이전틱 AI 확산으로 토큰 소비량이 기업 관리의 핵심 변수로 떠오른 현상에서 유래됐다.
기업이 AI 서비스를 활용할 때는 입력과 출력 과정에서 토큰이 발생한다. 예컨대 AI 에이전트가 보고서를 작성한다고 하면 관련 자료를 찾고 내용을 요약하는 과정에서 입력 토큰과 출력 토큰이 계속 쌓인다. 에이전트가 스스로 검증과 수정 단계를 반복할수록 전체 토큰 소비량이 커진다.
이 토큰 사용량에 따라 기업의 AI 활용 비용이 책정된다. AI 에이전트 확산과 맞물려 토큰 비용 또한 급증하면서 토크노믹스에 대비해야 한다는 게 업계 전문가들의 제언이다. 한 AI 기업 관계자는 "AI 에이전트는 단순한 챗봇처럼 한 번 묻고 닫는 구조가 아니다"라며 "여러 차례 AI 모델을 호출하기 때문에 토큰 사용량 관리가 비용 관리의 핵심이 될 수밖에 없다"고 말했다.
특히 고객센터나 사내 지식검색 등 사용량이 많은 영역에서는 작은 토큰 절감도 전체 비용에 큰 영향을 줄 수 있다. 한두 번의 호출에서는 차이가 작아 보여도 수천명 이상이 매일 사용하는 환경에서는 비용 차이가 빠르게 벌어질 수 있어서다.
최근 주요 AI 기업들이 고성능 모델과 경량 모델을 함께 내놓는 것도 이 같은 흐름과 맞닿아 있다. 오픈AI, 앤트로픽, 구글 등은 복잡한 추론이 필요한 업무에는 고성능 모델을, 단순 분류나 요약, 정형화된 응답에는 상대적으로 비용 효율적인 경량 모델을 활용하는 방향을 제시하고 있다.
또 다른 업계 관계자는 "AI 도입 초기에는 성능 좋은 모델이 우선이었지만 앞으로는 업무별로 비용을 통제하는 역량이 중요해질 것"이라며 "AI 에이전트를 대규모로 쓰는 기업일수록 토크노믹스가 핵심 화두가 될 것 같다"고 말했다.
이 같은 흐름은 AI 인프라 전략과도 연결된다. AI 토큰 비용을 줄이려면 데이터가 어디에 있고, 어떤 인프라에서 처리되는지까지 함께 봐야 하기 때문이다. 빅테크들도 이러한 흐름을 예의주시하며 새로운 사업 기회로 삼고 있다.
일례로 컴퓨팅 인프라 기업인 델 테크놀로지스는 최근 연례 행사를 통해 토크노믹스를 강조했다. 델은 AI 활용이 늘수록 기업이 단순히 그래픽처리장치(GPU)나 서버를 추가하는 것을 넘어, 데이터가 생성되고 저장되고 처리되는 전 과정을 함께 설계해야 한다고 제언했다. AMD도 토크노믹스 시대에 대응해 중앙처리장치(CPU) 기반 처리부터 비용 효율형 GPU, 고성능 가속기까지 아우르는 연산 포트폴리오 전략을 제시하는 등 토크노믹스가 업계 화두로 떠오른 모습이다.
다만 토크노믹스는 인프라 투자만으로 해결되는 문제는 아니다. 기업이 AI를 어떤 업무에 적용하고, 어떤 모델을 선택하며, 에이전트가 몇 차례 모델을 호출하도록 설계하는지가 함께 맞물린다. 이에 부서별 AI 사용량이나 업무별 토큰 소비량을 따지는 내부 거버넌스 모델 확보에 대한 요구도 커지고 있다.
업계 관계자는 "AI 에이전트는 생산성을 높이는 도구이자 기업 운영 비용의 게임체인저가 될 수 있다"며 "적절한 AI 모델을 적절한 업무에 적용하는 토크노믹스적 관점이 AI 활용 성패를 가를듯 하다"고 말했다.


1
2
3
4
5