멀티버스 컴퓨팅은 거대 LLM을 극도로 압축해 CPU만으로도 돌아가는 ‘작은 언어 모델(SLM)’을 앞세워 높은 기업가치를 인정받았다.
![리소스 소모가 큰 슬롯사이트 추천 대신 SLM이 주목 받고 있다.[사진=셔터스톡]](https://cdn.fortunekorea.co.kr/news/photo/202510/50206_43816_1259.jpg)
스페인 바스크의 산세바스티안. 파인 숲 언덕 위 회의실에서 슬롯사이트 추천 스타트업 멀티버스 컴퓨팅(Multiverse Computing) 엔지니어들이 전쟁터용 드론 슬롯사이트 추천를 시연했다. 노트북 CPU로 탱크와 병력을 가려낸다. 필요한 정보만 압축해 지상부대에 전송한다. 엔리케 리사소 올모스(Enrique Lizaso Olmos) 멀티버스 컴퓨팅 CEO는 “전력 소모가 극도로 적은 슬롯사이트 추천가 필요하다”고 말했다. 복잡해지는 상황에서도 드론은 에너지를 거의 쓰지 않는다.
멀티버스 컴퓨팅은 회사도 작다. 올해 예상 매출은 2500만 달러 수준. 그러나 아이디어는 크다. 핵심은 거대 언어 모델(LLM)을 압축해 더 작은 모델로 바꾸는 일. 대부분의 소비자와 기업은 고성능 LLM 대신, 잘 설계된 저전력 소형 모델로 충분하다는 믿음이다. 적은 전력. 적은 칩. 낮은 비용.
회의론도 있다. 압축 모델의 성능을 의심하는 목소리다. 그럼에도 고객사는 늘었다. 보쉬(Bosch), 무디스(Moody’s), 캐나다은행(Bank of Canada), 유틸리티, 방산업체 등이 쓰고 있다. 스페인 통신사 텔레포니카(Telefónica)의 고객센터 시스템을 재설계해 LLM 비용을 크게 줄였다. 이들의 SLM은 냉장고 같은 ‘스마트’ 가전에 올려 재고를 바로 알려주는 용도도 겨냥한다.
최근에는 딜로이트(Deloitte), 인텔(Intel)과 손잡고 미국 주(州) 메디케이드 같은 공공 시스템을 SLM으로 구동하는 프로젝트를 진행 중이다. 인텔 정부기술그룹의 버니 레게트(Burnie Legette)는 “사용자 입장에선 큰 차이를 못 느끼지만, 세금은 절약된다”면서 “LLM을 돌리는 비용은 매우 크다”고 설명했다.
이 전략은 실리콘밸리와 이사회에 던지는 질문과 맞닿아 있다. 슬롯사이트 추천가 과연 투자한 만큼 수익이 나느냐. 데이터센터의 전력·용수 부담은 감당 가능한가. 멀티버스는 이 과제를 정면 돌파한다는 이유로 포춘 ‘체인지 더 월드 2025’에도 올랐다.
수석과학책임자 로만 오루스(Román Orús·42)는 단호하게 말했다. “지금의 슬롯사이트 추천 방식엔 큰 문제가 있습니다. 근본적으로 잘못됐죠”. 그는 대부분 사용자가 거대 모델이 아니라 작고 저렴하며 에너지 효율적인 모델로도 충분하다고 본다. 항공권 예약이나 사칙연산 같은 단순 작업에 굳이 거대 LLM이 필요하냐는 반문이다.
2018년, 이들은 양자컴퓨팅으로 금융을 바꿀 수 있다는 논문을 함께 냈다. 리사소는 의사 출신으로 은행권을 거쳤고, 오루스는 양자물리학자였다. 시작은 왓츠앱 토론방. “우리가 뭔가를 건드렸구나 싶었죠”. 토론토대의 크리에이티브 디스트럭션 랩 초청을 받았고, VC들이 논문을 스타트업 후보들에게 돌렸다. 골드만삭스가 눈여겨봤다 해서 ‘골드만 페이퍼’라는 별명까지 붙었다. 직장을 그만두고 멀티버스가 탄생했다.
출시 6년. 그들의 제품은 ‘양자 영감(quantum-inspired)’이라 부른다. 양자물리 알고리즘으로 기존 컴퓨터를 학습시킨다. 전통적 프로그래밍보다 빠르고 영리하다고 설명한다. 수백만 파라미터로도 도는 SLM을 만든다. 오픈소스 LLM을 극한으로 줄여 스마트폰·PC의 CPU에서 돌린다. LLM 제작사의 협조도 필요 없다.
지금까지 두 차례에 2억 9000만 달러를 조달했다. 기업가치는 5억 달러를 넘겼다. 아직 대중적 이름은 아니다. 하지만 리사소는 앤트로픽(Anthropic·올해 매출 50억 달러 전망)급 성장을 자신한다.
올해 4월, 이들은 ‘슬림(Slim)’ 시리즈를 내놨다. 메타의 라마(Llama) 3종, 미스트랄(Mistral) 모델을 자체 알고리즘 ‘컴팩티파이(Compactif슬롯사이트 추천)’로 압축했다. 원본 대비 에너지 효율 84% 개선. 정확도 손실은 2~3% 수준이라는 주장이다. 컴퓨팅 비용도 크게 줄었다. ‘슈퍼플라이(Superfly)’는 허깅페이스(Hugging Face)의 오픈소스 모델을 휴대폰에 내려받을 수 있을 만큼 압축했다.
8월에는 ‘치킨브레인(ChickenBr슬롯사이트 추천n)’을 공개했다. 메타 라마 3.1을 압축한 모델로 일부 추론 기능을 담았다. 인텔의 스티븐 필립스(Stephen Phillips) 수석은 “다른 SLM과 달리 정확도 저하가 눈에 띄지 않았다”고 말했다.
우려는 과학계 내부에서도 나온다. 국제에너지기구(IEA)에 따르면 미국 데이터센터는 이미 전력의 약 4.4%를 쓴다. 2030년엔 전 세계 데이터센터 전력소비가 두 배 이상 불어날 전망이다. 그 시점엔 미국 데이터센터의 전력소비가 알루미늄·철강·화학 등 에너지 다소비 제조업 전체를 합친 것보다 많아질 수 있다.
멀티버스는 CPU 기반 소형 모델로 전력 곡선을 꺾자고 제안한다. 리사소는 말한다. “테크 기업들은 환경보다 비용을 더 의식합니다. 그런데 둘은 수렴하고 있어요. ‘그린=저렴’이면 기업은 전적으로 그린이 됩니다. 에너지 위기가 옵니다”.
물론 반론도 만만치 않다. 파리의 슬롯사이트 추천 솔루션 기업 에키메트릭스(Ekimetrics)의 테오 알베스 다 코스타(Théo Alves Da Costa)는 “그 주장은 아직 누구도 입증하지 못했다”고 말했다.압축엔 불가피하게대가가 따른다는 지적이다.
프랑스어처럼 언어 난도가 높은 환경에서 SLM이 LLM만큼 일하지 못했고, CPU로 바꾸자 속도가 크게 느려졌다는 테스트 결과도 들었다. 오픈소스 모델이 폐쇄형 대형 모델보다 성능이 뒤지는 경우도 흔하다고도 했다.
‘효율이 좋아지면 사용이 폭증한다’는 역설도 있다. 구글은 올해 8월, 제미니(Gemini)의 요청당 에너지 소비가 1년 전보다 33분의 1로 줄었다고 밝혔다. 그러나 2020~2024년 구글 데이터센터 전력소비는 오히려 2배 넘게 늘었다. 사용자 수가 폭증했기 때문이다.
멀티버스는 일단 가장 큰 오픈소스 모델을 가능한 한 끝까지 줄이는 데 집중한다. 다음 타깃은 딥시크(DeepSeek). 지난해 경쟁사 대비 극저비용 학습으로 업계를 뒤흔든 중국 생성형 모델이다. 멀티버스는 더 싸게, 더 작게 만들겠다고 예고했다. 여기에 한 가지를 더했다. 원본 모델의 정부 검열을 걷어냈다. 1989년 톈안먼 사태 같은 민감 주제에 접근이 가능하다. 리사소는“필터를 제거했다”고 말했다.또 하나의 파라미터를 뺀 셈이다.
/ 글 Vivienne Walt & 편집 김다린 기자 quill@fortunekorea.co.kr