RAG 대중화 주도한 파인콘, 이제 RAG 반대편에 베팅?
||2026.05.09
||2026.05.09
[디지털투데이 황치규 기자]RAG(Retrieval-Augmented Generation)를 지원하는 벡터 데이터베이스 시장을 개척한 회사들 중 하나인 파인콘(Pinecone)이 AI 에이전트와 관련해 지금까지는 다른 메시지를 내놓고 있다.
더뉴스택 최근 보도에 따르면 파인콘은 지난 4년간 80만 개발자에게 RAG를 지원하는 청킹(chunking), 임베딩(embedding), 검색 방법을 제공해왔고 5월초에는 에이전트용 지식 엔진 넥서스(Nexus)를 선보였다.
파인콘에 따르면 추론 시점에 검색하는 방식, 즉 RAG(Retrieval-Augmented Generation)는 과거를 상징한다. 검색-읽기-검색 루프에 갇힌 에이전트는 작업 50~60%만 완료할 수 있고 에이전트 하는 일 85%가 맥락을 가져오는 데 쓰인다.
원시 청크를 프런티어 모델에 넘기고 모델이 알아서 이해하길 바라는 방식, 다시 말해 기존 RAG는 불안정하고 느리고 비싸다는 것이 파인콘 주장이다.
기존 RAG는 에이전트가 질문을 받은 그 순간에 정보를 가져와 의미를 파악하는 반면 넥서스는 질문이 오기 전 미리 생각을 끝내두는 방식으로 요약된다.
파이콘이 넥서스와 함께 공개한 노우QL(KnowQL)은 이를 위한 쿼리 언어다. 파인콘은 이를 통해 작업 완료율이 90% 이상으로 오르고 토큰 비용은 90% 줄일 수 있다고 강조했다.
더뉴스택에 글을 쓴 자나키람 MSV는 "확인하기 전까지는 수치를 그대로 믿기 어렵지만 구조와 관련된 주장은 숫자와 무관하게 맞는 방향이다. 한 번 컴파일하고 여러 번 읽는 것이 에이전트 워크로드에 맞는 형태"라고 말했다.
파인콘만 이런 방향으로 움직이는게 아니다. 앤트로픽은 자주 쓰는 맥락을 번들로 묶어 재사용할 수 있는 스킬 형태로 출시했다. AI 코딩 툴 커서가 제공하는 커서 룰스(Cursor Rules)는 에디터 레이어에서 같은 역할을 한다. 클로드 코드 서브에이전트는 작업별로 맥락과 도구를 미리 패키징한다. 랭체인(LangChain) 해리슨 체이스는 몇 달째 이를 '컨텍스트 엔지니어링'이라고 불러왔다. 파인콘은 검색 레이어에서 이 패턴을 실행하는 것이란게 그의 설명이다.
반론도 있다. 자나키람 MSV는 "KnowQL이 진짜 힘을 발휘하려면 SQL처럼 업계 전체가 채택하는 표준이 돼야 한다. 하지만 표준은 한 업체가 선언한다고 만들어지는 건 아니다"고 지적했다.


1
2
3
4
5