"오픈AI, AI 모델 안전 테스트 축소"…'무모한 속도전' 우려 제기

AI타임스

입력: 2025-04-13 19:18

[박찬 기자]

(사진=셔터스톡)

오픈AI가 최신 인공지능(AI) 모델의 안전 평가에 들이는 시간과 자원을 대폭 줄이는 등 충분한 검증 없이 기술을 서둘러 출시하고 있다는 비판이 제기됐다.

파이낸셜타임스는 11일(현지시간) 내외부 테스트 관계자들을 인용, 오픈AI가 내부 직원과 외부 테스트 그룹에 최신 대형언어모델(LLM)의 위험과 성능을 테스트하는 평가 과정을 과거 수개월에서 이제는 며칠로 단축하라는 지시를 내리고 있다고 보도했다.

이에 따르면, 오픈AI의 테스트는 점점 허술해지고 있으며, 위험을 식별하고 이를 완화하기 위하기에는 시간과 자원이 부족하다고 전해졌다. 이는 구글과 앤트로픽, xAI는 물론, 딥시크 등 중국 기업까지 경쟁에 뛰어든 탓이다.

'o3' 내부 테스트에 참여 중인 한 관계자는 "기술이 지금보다 덜 중요했을 때는 오히려 더 철저하게 테스트했다"라고 지적했다. 이어 "모델이 점점 강력해질수록 오용될 가능성도 높아지지만, 시장 수요에 밀려 출시를 서두르고 있다"라며 "무모한 결정이며, 자칫하면 재앙이 될 수도 있다"라고 우려했다.

실제로 오픈AI는 o3를 이르면 다음 주 출시할 계획이며, 일부 테스트 인원에게는 일주일도 안 되는 기간만 제공된 것으로 전해졌다. 반면, 2023년에 출시된 'GPT-4'는 무려 6개월간의 사전 평가 기간이 주어졌다.

GPT-4를 테스트했던 한 관계자는 "위험한 기능 중 일부는 테스트 두달이 지나서야 발견됐다"라며 "현재 오픈AI의 방식은 공공의 안전을 전혀 우선시하지 않고 있다"라고 비판했다.

테스트 과정에는 외부 전문가 고용과 특수 데이터셋 구축, 내부 엔지니어 투입, 컴퓨팅 자원 확보 등 막대한 비용이 수반된다. 그러나 최근에는 다수의 프로젝트를 동시에 진행하는 데다, '챗GPT'의 인기로 컴퓨팅 리소스까지 부족한 것으로 알려졌다.

이에 대해 오픈AI는 자동화 시스템 도입 등으로 인해 테스트 기간을 단축했으며, 이를 최선이라고 밝혔다.

요하네스 하이데케 오픈AI 안전 시스템 책임자는 "재앙적 위험에 대해선 철저한 테스트와 완화 조치를 진행했다"라며 "우리는 속도와 철저함 사이에서 좋은 균형을 유지하고 있다"라고 해명했다.

테스트 모델이 실제 출시 모델과 다를 수 있다는 점도 지적되고 있다. 오픈AI는 '체크포인트(checkpoints)'라 불리는 중간 단계의 모델에서 테스트를 진행한 뒤 성능을 개선해 최종 모델을 공개하는데, 이는 평가 당시의 성능과는 다를 수 있다는 지적이다.

한 전직 오픈AI 기술직원은 "테스트한 모델과 출시한 모델이 다른 것은 매우 나쁜 관행"이라고 비판했다. 오픈AI는 이에 대해 "체크포인트와 실제 출시 모델은 사실상 동일하다"라고 반박했다.

박찬 기자 cpark@aitimes.com

<저작권자 copyright ⓒ ai타임스 무단전재 및 재배포 금지>

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

전체 댓글 0

댓글 운영정책

당신의 생각을 남겨주세요

0 / 1000

로그인 후 댓글을 작성해 주세요

댓글 블라인드 기능으로 악성댓글을 가려보세요!

블라인드

OFF

댓글 게시 제한 기준

글 본문에서 익명으로 처리된 인물의 실명이나 모자이크 처리된 사진의 원본 등을 공개하거나 해당 정보가 있는 웹페이지의 링크를 게시한 글
타인의 주민번호, 전화번호, 이메일주소 등의 개인정보를 당사자의 동의 없이 유포하는 글
욕설 또는 비속어를 사용하거나 국가/민족/인종/성별/지역/종교/빈부/교육/직업 등에 관해 차별이나 비하, 편견을 조장하는 내용을 담은 글
사실이 확인되지 않은 소문을 유포해 특정인 또는 특정 단체의 권리와 이익을 침해하는 글
상품 광고, 돈 벌기 사이트, 경품 지급, 사이트 링크 등 상업성 광고 게시글
댓글로 인해 권리를 침해당한 당사자가 해당 게시물에 대해 직접 삭제를 요청하는 경우
폭력∙사기 등 범죄를 유도하거나 관련 내용을 게시한 글
자살 등을 유도하거나 모의와 관련한 글. 생명을 경시하는 내용과 표현이 있는 글
윤락행위∙원조교제 등 불법 행위와 관련한 글. 또한 신체 특정 부위를 뜻하는 비속어를 사용한 저속한 게시글
줌인터넷 임직원을 사칭해 허위 내용을 유포하거나 특정한 행위를 유도하는 경우
청소년보호법에 근거 청소년에 유해하다고 판단되는 글
기타 관련 법률 및 약관을 위배하는 글

댓글 쓰기 제한 기준

위 댓글 게시 제한 기준에 해당하는 댓글을 반복해 게시하거나 타인의 댓글에 허위 신고를 하는 사용자는 경고 누적 정도에 따라 3일 혹은 무기한 댓글 쓰기가 제한 될 수 있습니다.
개인정보 유출, 명예훼손 등에 따른 피해가 확대되지 않도록 개별 기사의 댓글 쓰기 기능을 임시로 막을 수 있습니다.
상습적 홍보∙상업∙음란 글 게시자, 악의적 개인 인권 침해자, 그리고 댓글을 통해 서비스 이용에 심각한 악영향을 미치는 사용자는 경고 누적 정도에 관계 없이 무기한 댓글 쓰기가 제한 될 수 있습니다.
특정 IP를 통해 위 항목과 같은 사례가 발생하는 경우, 해당 IP에 대해 무기한 댓글 쓰기를 제한 할 수 있습니다.
글쓰기 제한은 서비스 내 모든 댓글과 게시판에 함께 적용됩니다.
부당하게 글쓰기 제한 조치를 받으신 이용자께서는 고객센터 고객센터 를 통해 의견을 접수하실 수 있습니다.

레이어 닫기

이 기사를 본 사람들이 선택한 뉴스

파이낸셜뉴스LG CNS, 베트남 다낭에 투자 눈독
뉴시스"최애 배우가 19금 올렸다고?"…인스타 신기능 주의령
뉴스1성기 모양 성인용품 노출한 JTBC '정숙한 세일즈'에 '의견진술'
뉴스웨이국내 최대 'AI 데이터센터' 예고한 SKT…울산 SK케미칼 대지 매입

ZUM 뉴스

"오픈AI, AI 모델 안전 테스트 축소"…'무모한 속도전' 우려 제기

이 기사를 본 사람들이 선택한 뉴스

쇼핑 핫아이템

글자크기 조절

"오픈AI, AI 모델 안전 테스트 축소"…'무모한 속도전' 우려 제기

이 기사를 본 사람들이 선택한 뉴스

쇼핑 핫아이템

공유하기

글자크기 조절