"사진 넣으면 심슨 그림체 뚝딱"…신세계 연 GPT 이미지

뉴스1

입력: 2025-03-28 10:35

'챗GPT-4o 이미지 제네레이션' 기술 혁신 조명

한땀씩 그려 정확성 높이고 통합 아키텍처 도입…학습법도 혁신

오픈AI 챗GPT 4o 이미지 폭삭 속았수다 포스터 심슨가족 버전 생성

(서울=뉴스1) 김민석 기자 = 오픈AI가 출시한 '챗GPT-4o 이미지 제네레이션'이 폭발적 인기를 끌면서 어떤 원리로 이미지를 생성하는지 관심이 쏠린다.

샘 올트먼 오픈AI CEO는 27일(현지시간) X(옛 트위터)에서 "어느날 아침 일어나보니 이용자가 저를 지브리 스타일로 바꿨다는 메시지가 수백 개나 와 있었다"며 자신의 프로필 사진을 실제 사진에서 지브리 화풍의 이미지로 교체했다.

샘 올트먼 오픈AI CEO X 갈무리

챗GPT-4o 이미지는 'GPT-4o' 기반 통합 이해·추론을 기반으로 다양한 이미지를 생성할 수 있다. 특히 △지브리 △심슨 △귀멸의칼날 △아기공룡 둘리 △슬램덩크 등 주요 애니메이션 화풍을 모방한 그림을 생성해 주목받고 있다.

실제 SNS에선 영화·드라마 장면을 만화 화풍으로 바꾼 이미지들이 급속도로 확산했다. 한국서도 넷플릭스 드라마 '폭싹 속았수다' 또는 영화 '기생충' 포스터를 다양한 만화 화풍으로 변환한 이미지들이 퍼지고 있다.

오픈AI 챗GPT 4o 이미지 4컷 카툰 생성

신세계를 연 기술 혁신은 이미지 생성 방식에 있다. 오픈AI에 따르면 기존 '달리3'(DALL-E3)는 '디퓨전'(Diffusion) 방식으로 이미지를 생성했지만. GPT-4o 이미지는 '자기회귀'(Auto Regressive) 방식을 채택했다.

자기회귀는 이미지를 한 번에 통째 생성하지 않고 왼쪽 위부터 오른쪽 아래로 차례로 그리는 방식이다. 사람이 그림을 그릴 때 전체를 한 번에 그리지 않고 한 부분씩 세심하게 작업하는 것과 유사하다. 텍스트를 한 글자씩 생성하는 언어모델 인공지능(AI) 작동 원리와도 비슷하다.

이를 통해 모델이 이미지 내 모든 요소를 정확하게 제어할 수 있다. 텍스트도 명확한 삽입이 가능하다.

이미지 생성 속도는 통합 모델 아키텍처를 채택해 높였다. 기존엔 텍스트·이미지·오디오 등 멀티모달 정보를 텍스트로 변환한 후 다시 처리해야했지만, GPT-4o는 텍스트·픽셀·사운드 데이터를 하나의 모델이 직접 처리하도록 처음부터 설계됐다.

챗GPT 4o 이미지 뉴턴 프리즘 실험 생성

학습 방식 역시 진일보했다. GPT-4o는 텍스트·이미지 등을 개별 학습하지 않고 '조합분포'(joint distribution) 방식으로 이미지와 언어, 이미지 간 관계 등을 통합적으로 학습한다. 이같은 원리로 '뉴턴의 프리즘 실험-빛의 스펙트럼' 다이어그램 등도 생성할 수 있다는 설명이다.

아울러 여러 객체의 모양·색상·위치 관계를 정확히 파악·유지하는 능력(속성 바인딩)도 발전했다.

가브리엘 고 오픈AI 멀티모달 담당 연구책임자는 "기존 모델은 항목이 5개만 넘어가도 특성을 섞어 그리는 한계를 보였지만, GPT-4o 이미지 모델은 속성 바인딩이 우수해 최대 15개 이상의 객체를 정확하게 생성할 수 있다"고 설명했다.

ideaed@news1.kr

Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스1 주요뉴스

해당 언론사로 연결

전체 댓글 0

댓글 운영정책

당신의 생각을 남겨주세요

0 / 1000

로그인 후 댓글을 작성해 주세요

댓글 블라인드 기능으로 악성댓글을 가려보세요!

블라인드

OFF

아직 댓글이 없습니다.

댓글 게시 제한 기준

글 본문에서 익명으로 처리된 인물의 실명이나 모자이크 처리된 사진의 원본 등을 공개하거나 해당 정보가 있는 웹페이지의 링크를 게시한 글
타인의 주민번호, 전화번호, 이메일주소 등의 개인정보를 당사자의 동의 없이 유포하는 글
욕설 또는 비속어를 사용하거나 국가/민족/인종/성별/지역/종교/빈부/교육/직업 등에 관해 차별이나 비하, 편견을 조장하는 내용을 담은 글
사실이 확인되지 않은 소문을 유포해 특정인 또는 특정 단체의 권리와 이익을 침해하는 글
상품 광고, 돈 벌기 사이트, 경품 지급, 사이트 링크 등 상업성 광고 게시글
댓글로 인해 권리를 침해당한 당사자가 해당 게시물에 대해 직접 삭제를 요청하는 경우
폭력∙사기 등 범죄를 유도하거나 관련 내용을 게시한 글
자살 등을 유도하거나 모의와 관련한 글. 생명을 경시하는 내용과 표현이 있는 글
윤락행위∙원조교제 등 불법 행위와 관련한 글. 또한 신체 특정 부위를 뜻하는 비속어를 사용한 저속한 게시글
줌인터넷 임직원을 사칭해 허위 내용을 유포하거나 특정한 행위를 유도하는 경우
청소년보호법에 근거 청소년에 유해하다고 판단되는 글
기타 관련 법률 및 약관을 위배하는 글

댓글 쓰기 제한 기준

위 댓글 게시 제한 기준에 해당하는 댓글을 반복해 게시하거나 타인의 댓글에 허위 신고를 하는 사용자는 경고 누적 정도에 따라 3일 혹은 무기한 댓글 쓰기가 제한 될 수 있습니다.
개인정보 유출, 명예훼손 등에 따른 피해가 확대되지 않도록 개별 기사의 댓글 쓰기 기능을 임시로 막을 수 있습니다.
상습적 홍보∙상업∙음란 글 게시자, 악의적 개인 인권 침해자, 그리고 댓글을 통해 서비스 이용에 심각한 악영향을 미치는 사용자는 경고 누적 정도에 관계 없이 무기한 댓글 쓰기가 제한 될 수 있습니다.
특정 IP를 통해 위 항목과 같은 사례가 발생하는 경우, 해당 IP에 대해 무기한 댓글 쓰기를 제한 할 수 있습니다.
글쓰기 제한은 서비스 내 모든 댓글과 게시판에 함께 적용됩니다.
부당하게 글쓰기 제한 조치를 받으신 이용자께서는 고객센터 고객센터 를 통해 의견을 접수하실 수 있습니다.

레이어 닫기

이 기사를 본 사람들이 선택한 뉴스

이데일리카카오 '다음' 분사 고용안정 합의…급한불 껐지만 불씨 여전
비즈워치'전문경영 내세운' 한미그룹, 효율 드라이브 걸리나
YTN문닫은 태백 폐광이 우주 실험실로?...우주자원 장비 실증시설 구축
중앙일보의대 40곳 중 38곳 ‘전원 복귀’…온라인 강의 시작
디지털데일리소주 도수, 광고규제 때문에 계속 낮아진다? [IT클로즈업]

ZUM 뉴스

"사진 넣으면 심슨 그림체 뚝딱"…신세계 연 GPT 이미지

뉴스1 주요뉴스

이 기사를 본 사람들이 선택한 뉴스

쇼핑 핫아이템

글자크기 조절

"사진 넣으면 심슨 그림체 뚝딱"…신세계 연 GPT 이미지

뉴스1 주요뉴스

이 기사를 본 사람들이 선택한 뉴스

쇼핑 핫아이템

공유하기

글자크기 조절