[그래픽=그록] |
글로벌 빅테크 기업의 올해 인공지능(AI) 전략 핵심 키워드로 ‘멀티모달’과 ‘저비용’이 떠올랐다.
새해가 시작되면서 주요 빅테크 기업들은 일제히 올해의 AI 전략을 발표하고 있으며, 공통적으로 강조되는 방향성은 단일 텍스트 모델 중심의 시대를 넘어 고도화된 멀티모달 AI 에이전트로 수익성을 극대화하겠다는 목표다.
특히 “텍스트만으로는 더 이상 돈이 되지 않는다”는 인식이 업계 전반에 자리 잡으면서, 빅테크 기업들은 멀티모달 기반의 실사용 서비스와 에이전트 생태계 확장에 속도를 내고 있다.
22일 IT업계에 오픈AI는 GPT‑5를 기반으로 한 통합 고지능 모델 전략을 강화하며 이커머스 자동화, 의료 영상 분석 지원, 채용 매칭 등 다양한 산업군으로 확장하고 있다.
2025년 말 기준 GPT‑5는 고도화된 시각·음성 이해 능력과 실시간 반응성을 갖추며 기업용 AI 인프라의 표준으로 자리 잡았고, 100만 개 이상의 기업이 오픈AI 제품군을 도입한 것으로 집계된다.
구글 역시 제미나이 기반 멀티모달 모델을 고도화하며 경쟁에 뛰어들고 있다. 글로벌 기업들은 단일 모델로 텍스트·이미지·음성·영상·구조화 데이터를 모두 처리할 수 있는 ‘통합형 AI’를 핵심 경쟁력으로 인식하고 있으며, 구글은 이를 중심으로 검색·클라우드·생산성 도구 전반에 멀티모달 기능을 확장하고 있다.
마이크로소프트는 GPT 계열 모델을 기반으로 한 다중 모델 전략을 강화하며 윈도우, 오피스, 애저 전반에 멀티모달 에이전트를 기본 탑재하는 방향으로 전환하고 있다. 메타는 라마(Llama) 차세대 모델을 중심으로 프론티어 모델 상용화를 추진하고 있으며, 아마존은 AWS 기반 멀티모달 에이전트 생태계를 확장해 기업용 자동화 시장을 공략하고 있다.
글로벌 빅테크 기업의 이같은 움직임은 AI 시장이 ‘도구 중심’에서 ‘업무 대행형 에이전트 중심’으로 이동하고 있음을 보여준다.
국내 시장에서도 변화는 빠르게 진행되고 있다. 국내 빅테크 기업들은 글로벌 수준의 언어모델 개발을 지속하면서도, 실제 시장에서는 스타트업 중심의 응용 서비스가 빠르게 확산되고 있다.
의료 AI 기업 루닛은 영상 기반 진단 솔루션을 고도화하며 글로벌 시장에서 영향력을 확대하고 있다. 라이너, 포티투마루 등은 RAG(검색 기반 생성) 기술을 활용하는 스타트업들은 문서 분석, 기업용 지식관리, 법률·금융 데이터 처리 등 특화 영역에서 경쟁력을 확보하고 있다. 노타 등 온디바이스 AI를 개발하는 기업들은 경량화 모델을 기반으로 스마트폰·IoT 기기·로봇 등에서 실시간 멀티모달 처리를 구현하며 새로운 시장을 열고 있다. 번역 AI 분야에서도 글로벌 수요가 증가하며 플리토 등 국내 기업의 기술 경쟁력이 강화되고 있다
이처럼 글로벌과 국내 모두 멀티모달 AI 에이전트 시장을 향해 질주하고 있지만, 올해 승부를 가르는 핵심 변수는 ‘토큰 비용’이다. 특히 멀티모달 모델은 텍스트 모델 대비 연산량이 훨씬 크기 때문에, 토큰 단가를 낮추지 못하는 기업은 시장 경쟁에서 뒤처질 가능성이 높다.
딜로이트의 ‘엔터프라이즈 AI 현황 보고서 2026’는 기업들이 AI를 파일럿에서 실제 운영으로 확장하는 과정에서 ROI(비용 대비 효율)가 핵심 과제로 부상했다고 분석했다.
이는 곧 오픈AI, 구글, MS, 아마존 등의 AI 인프라 규모 경쟁이 단순한 기술 과시가 아니라 비용 절감과 직결된 전략적 선택임을 의미한다.
결국 2026년 AI 시장의 승자는 멀티모달 기술의 완성도뿐 아니라 이를 얼마나 저비용 구조로 제공할 수 있는지가 결정할 전망이다. 빅테크 기업들이 앞다투어 멀티모달 에이전트 생태계를 확장하고 있지만, 기업 고객과 소비자들이 실제로 선택할 서비스는 ‘가장 똑똑하면서도 가장 저렴한 AI’가 될 가능성이 높다는 것이 업계의 관측이다.
김성현 기자 minus1@ajunews.com
- Copyright ⓒ [아주경제 ajunews.com] 무단전재 배포금지 -































































