컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
디지털투데이 언론사 이미지

1800년대 데이터로만 학습…'타임캡슐 LLM'의 역사적 실험

디지털투데이
원문보기
[AI리포터]

[디지털투데이 AI리포터] 인공지능(AI)이 현대적 편향을 배제하고 특정 시대의 관점만 학습하도록 설계된 타임캡슐 LLM(TimeCapsule LLM)이 개발됐다.

14일(현지시간) 온라인 매체 기가진에 따르면, 1800~1875년 데이터를 기반으로 훈련된 이 모델은 당시의 언어와 세계관을 반영하는 데 초점을 맞췄다.

개발자 하이크 그리고리안은 "AI가 역사적 AI처럼 행동한다면 어떤 결과가 나올까?"라는 질문에서 프로젝트를 시작했다고 한다. 초기 버전은 단순한 모델에서 출발했지만, 마이크로소프트의 파이 1.5(Phi 1.5)를 기반으로 한 버전 1에서는 실제 역사적 사건과 인물을 연결하는 수준까지 발전했다.

타임캡슐 LLM은 당시 사회적 편향까지 반영하도록 설계됐다. 예를 들어, 데이터셋에서 남성 대명사가 여성 대명사보다 압도적으로 많이 등장하며, '런던', '잉글랜드' 같은 지명은 빈번하게 언급되지만 '아프리카', '미국'은 상대적으로 적게 등장한다. 이는 19세기 영국 중심의 시각을 반영한 결과다.

버전 2는 1800~1875년 런던에서 출판된 서적, 법률 문서, 신문 등 90GB 규모의 데이터를 활용해 학습할 예정이지만, 현재는 15GB 데이터만으로 훈련된 미니 버전이 존재한다. 예를 들어, '찰스 디킨스'에 대한 질문에 대해 당시 사회적 맥락과 감정까지 반영한 답변을 생성할 정도로 정교해졌다.

해커 뉴스(Hacker News)에서도 "1900년 이전 데이터로 AI를 훈련하고, 이후 양자역학이나 상대성 이론을 학습하게 하면 AI가 과학적 발견을 스스로 할 수 있는지 검증할 수 있다"는 의견이 나왔다.

타임캡슐 LLM은 AI가 단순히 데이터를 반복하는 것을 넘어, 역사적 맥락을 이해하고 새로운 통찰을 만들어낼 가능성을 실험하는 프로젝트로 주목받고 있다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1장윤정 고현정 기싸움
    장윤정 고현정 기싸움
  2. 2김병기 금고 추적
    김병기 금고 추적
  3. 3김병기 금고 행방 추적
    김병기 금고 행방 추적
  4. 4박나래 전 매니저 고소
    박나래 전 매니저 고소
  5. 5연말정산 간소화 서비스
    연말정산 간소화 서비스

디지털투데이 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD