빅테크·스타트업 LLM개발 속속 참전
프라이빗LLM 환각·비용 적고 성능 ↑
글로벌 빅테크 기업과 스타트업들이 ‘거대언어모델(LLM)’ 개발에 뛰어든 가운데, 퍼블릭 LLM의 단점을 보완한 프라이빗LLM의 업계 관심이 커지고 있다.
3일 관련 업계에 따르면, 현재 B2B 생성형 AI 시장은 크게 ‘퍼블릭(public) LLM’과 ‘프라이빗(private) LLM’ 진영으로 나눠져 있다. LLM은 많게는 수백억개 적게는 수억개의 매개변수(파라미터)를 보유한 언어 모델로 생성형 AI의 엔진으로 불리는 모델이다.
퍼블릭LLM은 챗GPT 등으로 생성형AI 대중화를 이끈 모델이다. 오픈AI, 구글 등 빅테크 등이 일찌감치 뛰어들며 초기 시장을 선점했다. 하지만 외부 클라우드 사용으로 데이터 유출 리스크와, 잘못된 정보를 생성하는 환각 현상(할루시네이션) 등의 문제점이 불거졌다. 실제 애플, 아마존, 삼성전자 등에서 내부 임직원들에게 '챗GPT 경계령’을 내리는 등 보안 이슈로 도입을 꺼리는 기업들이 생겨났다.
이에 대한 대항마로 생겨난 게 프라이빗 LLM이다. 표현 그대로 기업의 내부 데이터만 활용해 보안성을 높이고 거짓 정보를 생성하는 환각 현상 방지에 최적화된 모델이다. 여기에 상대적으로 작은 모델 사이즈로 비용 측면에서도 각광받으며 차세대 생성형 AI 시장 대세론을 타고 있다.
프라이빗 LLM의 핵심은 보안성이다. 기업 서버에 설치하는 구축형 ‘온프레미스’(on-premises) 방식이나 전용 프라이빗 클라우드로 도입, 기업의 민감 데이터가 유출될 가능성을 전면 차단한다. 이를 통해 기업들은 LLM 도입의 최대 허들인 데이터 및 민감 정보 유출을 방지할 수 있다.
또 생성형 AI의 고질적인 문제이자 현재 LLM의 최대 한계점으로 꼽히는 환각 방지에 특화된 모델이다. 프라이빗 LLM은 범용 모델과 달리 기업 내부 데이터로 학습 대상을 제한한다. 그만큼 거짓 정보를 생성할 가능성이 낮아져 사용성을 향상한다.
작은 사이즈로도 비용 대비 효과를 극대화할 수 있는 점도 장점이다. 프라이빗 LLM은 보통 100B (1조) 사이즈 이하의 경량 모델로, 흔히 ‘ss(small-scale) LLM’으로 불린다. 이에 비해 오픈AI의 GPT-4 매개변수(파라미터)는 5000억개로 추산되고, 구글의 ‘제미니’는 조 단위에 이르는 등 모델 사이즈가 상당하다. 매개변수가 큰 만큼 모델 서빙 비용이 상당할 수밖에 없는 구조다.
프라이빗 LLM은 훨씬 작은 모델 사이즈로도 성능은 빅테크에 필적한다. 예를 들어 업스테이지는 지난 8월 700억 매개변수 모델로 글로벌 머신러닝 플랫폼 ‘허깅페이스’에서 운영하는 ‘오픈 LLM 리더보드’ 평가 순위에서 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 세계 1위를 차지하기도 했다. 추론과 상식 능력, 언어 이해 종합능력 및 할루시네이션 방지 등 4가지 지표 평균에서 빅테크의 거대 모델을 능가한 것이다. 특히 업스테이지는 자사의 LLM 활용 시 GPT-3.5 대비 비용은 40% 감축하고, 처리 속도는 30% 빠른 것으로 추산했다.
이에 많은 기업들은 프라이빗 LLM의 강점을 내세운 다양한 애플리케이션으로 영토를 확장하고 있다. 일례로 세일즈포스는 최근 대화형 AI 어시스턴트 ‘아인슈타인 코파일럿’을 선보였다. 세일즈포스 데이터 클라우드에 저장된 각종 정형·비정형 데이터를 토대로 콘텐츠와 코드를 생성해 준다. 기업이 보유한 정확한 고객 데이터에 기반해 환각 현상이 적고, 데이터는 세일즈포스의 고객관계관리(CRM) 데이터 클라우드에 보관함으로써 안전성도 담보했다. 업스테이지 역시 자체 LLM 솔라(SOLAR)를 활용해 다나와 운영사인 커넥트웨이브와 롯데쇼핑에 유통 플랫폼 특화 생성 AI를 구축 중이다.
업계 한 관계자는 "생성형 AI 도입을 통한 디지털 체질 개선은 이제 대세를 넘어 필수로 자리 잡는 추세"라며 "기업들은 이제 LLM을 도입할지 망설이기보다 어떤 LLM을 니즈에 맞게 도입해 경쟁 우위를 달성할 것인가를 고민할 때가 됐다"고 말했다.