마이크 크리거 앤스로픽 최고제품책임자(CPO)가 19일 서울 송파구 시그니엘 서울에서 열린 앤스로픽 개발자 행사 '코리아 빌더 서밋'에서 발표하고 있다. 이날 앤스로픽은 MCP에 대해서도 설명했다. 콕스웨이브 |
'인공지능(AI) 에이전트를 위한 USB' 'AI 업계의 http'.
최근 실리콘밸리와 AI 업계에서 가장 뜨거운 키워드 중 하나인 '모델 콘텍스트 프로토콜(MCP·Model Context Protocol)'에 붙어 있는 별명이다.
어떤 디바이스든 쉽게 연결할 수 있도록 해주는 USB(Universal Serial Bus)나 인터넷 시대를 여는 데 큰 기여를 한 http(Hyper Text Transfer Protocol) 같은 역할을 MCP가 해줄 수 있을 것이라는 기대감이다.
MCP는 지난해 11월 AI 모델 '클로드'를 만드는 앤스로픽이 오픈소스로 공개한 표준(protocol)이다. GPT, 제미나이, 클로드 같은 대규모언어모델(LLM)이 구글 시트나 슬랙, 세일즈포스 같은 기존에 존재한 앱의 API나 데이터와 정보를 주고받기 위한 목적으로 쓰인다. 이를 통해 AI 에이전트가 할 수 있는 일이 훨씬 많아지는 것이다. LLM 기반 앱(MCP 클라이언트)은 각 앱이 제공하는 MCP 서버와 프로토콜을 통해 데이터를 주고받는다. 이때 MCP 서버는 자사의 기능 목록과 데이터를 LLM이 이해할 수 있는 형태로 설명을 제공한다.
MCP와 같이 LLM과 다른 앱을 연결하는 표준을 만들려는 시도는 그전에도 있었다. 오픈AI는 2023년 플러그인 기능을 통해 외부 앱과 연결하는 계획을 발표했다. 하지만 이는 오픈AI 중심의 폐쇄적 생태계로 많은 참여자를 이끌어내지 못했다.
그러나 앤스로픽이 MCP를 오픈소스로 공개하자 이를 중심으로 AI 에이전트 생태계가 구성되는 모습이다. MCP 서버를 모아놓은 사이트인 스미서리(Smithery)에는 이미 3700여 개(4월 2일 기준)가 등록돼 있다. 3700여 개의 앱에 AI가 접근할 수 있는 것이다.
그동안 AI 에이전트가 시장에서 큰 호응을 만들지 못한 것은 에이전트가 실제로 할 수 있는 일이 많지 않았기 때문이다. 하나하나 앱들과 직접 연결해야만 했다. 하지만 MCP가 광범위하게 도입되면 다양한 역할을 할 수 있는 AI 에이전트가 쏟아져나올 것으로 기대된다.
이주환 스윗 대표는 자신의 페이스북에 "MCP가 에이전트 생태계의 표준 프로토콜로 성장할 가능성이 높다"면서 "매번 LLM과의 통신을 직접 짜야 했던 기존 방식과 달리 MCP를 한 번 구축해 놓으면 모든 MCP 클라이언트에서 재사용이 가능한 연결점이 돼 확장성이 매우 높다"고 평가했다.
MCP의 유행을 이끈 중요한 요소는 '커서'와 같은 AI 코딩 어시스턴트다. 이 코딩 어시스턴트 서비스에 MCP를 연결해서 훨씬 효과적으로 코딩을 할 수 있기 때문이다. 개발자가 직접 코딩을 입력하지 않고 AI에 명령을 내려서 코딩을 하는 '바이브 코딩'이 유행하면서 MCP도 많은 개발자가 사용하게 됐다. 다만 MCP가 리스크가 될 수 있다는 설명도 나온다. 기존의 소프트웨어와 달리 LLM은 예상치 못한 행동을 하는 경우도 있기 때문에 AI 에이전트가 중요 데이터와 앱에 접근하면 사고가 발생할 수 있다는 것이다.
MCP를 기반으로 하는 AI 에이전트와 함께 최근 부각되는 것은 브라우저를 조종하는 에이전트다. 앤스로픽이 지난해 10월 공개한 컴퓨터 유즈(Computer Use)는 AI가 사용자의 컴퓨터 화면을 보고 커서와 타이핑 등을 대신해줄 수 있다. 개인 사용자 차원에서 AI 에이전트가 유저를 도와주는 한 가지 방법을 제시한 것이다.
오픈AI는 올해 1월 AI가 웹 브라우저를 움직이는 '오퍼레이터(Operator)'를 공개했다. 개인 사용자가 가장 많이 이용하는 브라우저 사용을 AI에 맡겨서 AI가 나 대신 일을 할 수 있게 해주는 것이다.
이처럼 AI가 사용자의 컴퓨터를 대신 사용하게 되면 MCP처럼 프로토콜을 만들고 API를 가져올 필요 없이 인간이 컴퓨터를 사용하듯 AI 에이전트도 사용하면 되기 때문이다. 아마존도 지난달 31일(현지시간) 사용자 대신 여러 작업을 수행할 수 있는 AI 에이전트 '노바 액트(Nova Act)'를 공개했다. 노바 액트는 브라우저를 조종해 역시 다양한 업무를 대신해줄 수 있다. 아마존의 전자상거래 사업과 연결 지점이 많을 것으로 예상되고 있다.
중국 스타트업 버터플라이 이펙트가 만들어 공개한 '마누스'는 AI 에이전트로 다양한 행동을 실제로 할 수 있다. 회사 측에 따르면 마누스는 독립적으로 생각하고 계획하고 복잡한 업무를 수행해 결과물을 만들어낸다. 일본 여행 계획을 짜거나 테슬라 주가에 대한 심층 분석을 내놓는 등의 영상이 공개됐다. 마누스가 이런 다양한 업무를 해내는 것은 스타트업 '브라우저 유즈'의 기능을 사용했기 때문이다.
기존 AI는 스크린샷 기반으로 이미지를 직접 보고 움직이기 때문에 탐색이 느리고 오류가 잦다는 단점이 있다. 하지만 브라우저 유즈는 웹사이트를 AI가 이해할 수 있는 형태로 변환한다. 이를 통해 AI가 훨씬 효율적으로 브라우저를 작동할 수 있게 만드는 것이다.
[실리콘밸리 이덕주 특파원]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]