셀렉트스타 레드티밍 기술, NLP 최고 권위 학회 ACL 채택

[디지털투데이 손슬기 기자] AI 데이터·신뢰성 평가 기업 셀렉트스타는 자체 개발한 레드티밍 기술 '스타티밍'이 자연어처리(NLP) 분야 최정상급 학회 'ACL 2026'에 공식 채택됐다고 14일 밝혔다.

이번에 채택된 논문은 대형언어모델(LLM)의 안전성을 검증하는 자동화 레드티밍 방법을 다룬다. 레드티밍은 AI 모델에 의도적으로 유해한 요청을 시도해 취약점을 찾아내는 안전성 평가 방법이다.

스타티밍은 통계 물리학 기반 수학적 모델링으로 공격 전략과 모델 응답 간의 관계를 학습해 확률적으로 최적의 전략을 선택한다. 기존 방식이 과거 성공 사례를 반복하는 구조였다면, 이 기술은 수많은 시도와 실패를 분석해 상황에 맞는 전략을 스스로 찾아낸다는 설명이다.

클로드, 젬마, GPT, 라마, 큐웬 등 LLM 17개를 대상으로 한 검증에서 스타티밍은 표준 벤치마크 기준 평균 공격 성공률 74.5%를 달성했다. 기존 최고 방법인 오토DAN-터보(61.0%) 대비 13.5%포인트 높은 수치다.

해당 기술은 셀렉트스타의 AI 신뢰성 검증 솔루션 '다투모 플랫폼'에 탑재됐다. 전자·가전 제조, 시스템통합(SI) 및 IT 서비스 등 국내 주요 산업군과 정부 주도 독자 AI 파운데이션 모델 프로젝트에도 적용 중이다.

논문 제1저자인 정민재 셀렉트스타 AI세이프티 엔지니어는 "AI의 취약점을 더 체계적으로 발견할 수 있는 구조를 제시하고자 했다"며 "LLM이 실제 산업 현장에서 안전하게 활용될 수 있도록 다투모 플랫폼의 기술 고도화에 기여하겠다"고 말했다.

장기렌트 인기TOP