오픈AI 새 이미지 모델이 생성한 '뉴턴의 프리즘 실험'/오픈AI 제공 |
챗GPT 개발사 오픈AI가 기존 이미지 생성 AI보다 더 정교하고 직관적인 새로운 이미지 생성 모델을 25일(현지시각) 공개했다. 이 모델은 텍스트와 이미지를 통합한 첫 번째 모델로, 복잡한 요청도 이해하고 이용자의 의도를 반영해 이미지를 생성하는 것이 특징이다.
오픈AI는 이번에 출시한 ‘챗GPT-4o 이미지 생성’(ChatGPT-4o Image Generation) 모델이 텍스트 기반 언어 지능을 가진 GPT-4와 이미지 생성 기능을 결합한 모델이라고 밝혔다. 오픈AI는 이를 통해 텍스트의 의미를 깊이 이해하면서도 시각적으로 정교한 이미지를 만들어내는 AI를 구현했다고 설명했다.
특히 텍스트 삽입 기능이 크게 개선돼, 다양한 고래의 종류를 포함한 포스터나 대사가 포함된 카툰 등도 정확히 표현할 수 있다. 기존 모델은 글씨가 깨지거나 객체와 텍스트 간의 관계를 제대로 이해하지 못하는 경우가 많았지만, 새 모델은 이 같은 한계를 극복했다는 평가다.
자연법칙을 설명하는 이미지나 수학 공식, 메뉴판, 비즈니스 로고 등도 요청만으로 쉽게 생성할 수 있으며, 투명 배경도 지원해 스티커 제작 등 실용적인 활용도 가능하다.
오픈AI는 이 모델이 기존 ‘달리’의 단순한 업그레이드가 아니라, 전혀 다른 기술 기반에서 개발된 만큼 기능과 성능 모두 대폭 개선됐다고 강조했다. 새 모델은 한국어를 포함한 다양한 언어를 지원하며, 챗GPT 프로 유료 이용자는 물론 무료 이용자도 사용할 수 있다.
이경탁 기자(kt87@chosunbiz.com)
<저작권자 ⓒ chosunbiz.com, 무단전재 및 재배포 금지>