컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
AI타임스 언론사 이미지

사카나 AI, 최고 수준 코딩 대회서 인간 800명 제치고 우승

AI타임스
원문보기
[박찬 기자]
(사진=사카나 AI)

(사진=사카나 AI)


사카나 AI가 개발한 코딩 에이전트 'ALE-에이전트(ALE-Agent)'가 고난도 최적화 문제를 다루는 국제 코딩 대회에서 인간 최상위 프로그래머들을 제치고 우승을 차지하며, 차세대 자율형 AI 에이전트의 가능성을 보여줬다.

사카나는 13일(현지시간) ALE-에이전트로 최근 열린 엣코더(AtCoder) 휴리스틱 콘테스트 'AHC058'에서 1위를 차지했다고 발표했다.

이 대회는 정답이 정해진 간단한 코드를 작성하는 시험과 달리, 여러 경우를 탐색하고 전략을 세우며 반복해서 개선하는 어려운 최적화 문제를 다룬다. 단순한 코딩 실력을 넘어, AI가 실제로 얼마나 복잡한 문제를 잘 해결할 수 있는지를 보여주는 까다로운 대회로 평가받고 있다.

ALE-에이전트는 제한 시간(4시간) 동안 '추론 시간 확장(inference-time scaling)' 기법을 활용해 수백가지 해법을 만들어보고, 검증하고, 계속 개선하면서 문제를 풀었다.

그 결과, 최고 수준의 경쟁 프로그래머를 포함해 800명 넘는 인간 참가자들보다 더 뛰어난 성적을 거뒀다.

이번 대회의 문제는 계층적으로 연결된 여러 기계를 운용해, 정해진 턴 안에서 생산량을 최대한 끌어올리는 전형적인 최적화 과제였다. 예를 들면 사과를 만드는 기계가 있고, 그 기계를 다시 생산하는 기계도 함께 관리해야 하는 구조다. 이런 문제는 실제 기업 현장에서의 물류 관리나 자원 배분, 시스템 운영을 최적화하는 상황과 매우 비슷하다.


또 이런 유형은 전통적으로 도메인 전문가가 '무엇을 잘했다고 볼 것인지'에 대한 기준을 정하고, 엔지니어가 그 기준을 최대화하도록 프로그램을 만드는 방식으로 해결해 왔다.

보통은 그리디(Greedy) 알고리즘으로 먼저 간단한 초기 해답을 만든 뒤, 시뮬레이티드 어닐링을 이용해 조금씩 성능을 개선한다. 즉, 단순한 규칙으로 출발해 점진적으로 다듬는 방식이다. 하지만 처음 설정한 해답의 방향이 잘못되면, 이후에 아무리 조정해도 성능을 크게 끌어올리기 어렵다는 근본적인 한계가 있다.

ALE-에이전트가 이번에 보여준 가장 주목할 점은 기존의 고정된 풀이 방식을 벗어났다는 것이다. 에이전트는 눈앞의 성과만 따지지 않고, 아직 바로 작동하지 않는 요소에도 미래 가치를 매기는 '가상 파워(Virtual Power)'라는 개념을 스스로 만들어냈다. 내부 로그에서는 이를 '복리 효과(compound interest effect)'라고 설명했는데, 당장 이익이 적더라도 앞으로 더 큰 효과를 낼 수 있는 선택을 미리 고려하는 전략이다.


또 하나 중요한 점은 4시간 동안 전략의 방향을 잃지 않았다는 것이다. 긴 시간 추론을 하다 보면 생각의 흐름이 흐트러지는 경우가 많은데, ALE-에이전트는 매번 시도 후 텍스트로 된 '인사이트'를 정리해 쌓아두며 이미 실패한 전략을 다시 쓰지 않도록 했다. 그 결과 즉각 반응만 하는 단기 반응형 AI가 아니라, 기억을 활용해 오래 생각하며 판단하는 장기 추론 에이전트에 가까운 모습을 보였다.

아울러 ALE-에이전트는 기존처럼 단계를 나누지 않고, 그리디 방식을 시뮬레이티드 어닐링 과정에 섞어 사용했다. 여기에 상황이 나쁘다고 판단되면 해법의 일부를 조금씩 고치는 데 그치지 않고, 큰 구조를 과감히 지우고 다시 만드는 빠른 재구성 방식도 활용했다. 덕분에 특정 해법에 갇혀 더 이상 개선되지 않는 문제를 효과적으로 피할 수 있었다는 설명이다.


사카나 AI는 이번 성과가 실제 기업 환경에서도 에이전트를 활용할 수 있다는 의미라고 설명했다. 이미 성과를 판단하는 기준(지표)이 정해져 있는 기업이라면, 사람이 복잡한 최적화 알고리즘을 일일이 만들지 않아도 된다는 것이다. 사람이 "무엇이 좋은 성과인지"를 정의하고, 에이전트가 구현과 최적화를 맡는 구조가 가능해진다고 밝혔다.


이 방식은 차량 이동 경로 최적화, 서버 부하 분산, 자원 배치처럼 다양한 산업 문제에 적용할 수 있다. 사카나 AI는 벤처비트와의 인터뷰에서 "장기적으로는 기술 지식이 없는 사람도 조건을 조금씩 바꿔 보며 바로 결과를 확인할 수 있는, 이른바 '최적화의 민주화(Democratization of optimization)'로 이어질 가능성도 있다"라고 전했다.

다만, 비용 부담은 적지 않다. ALE-에이전트를 4시간 동안 실행하는 데에는 1300달러(약 191만원)의 연산 비용이 들었고, 'GPT-5.2'와 '제미나이 3 프로' 등 여러 모델을 대상으로 4000회가 넘는 추론 호출이 이뤄졌다.

하지만, 사카나 AI는 최적화 문제의 특성상 수천달러 수준의 일회성 비용으로 연간 수백만달러에 달하는 효율 개선을 이룰 수 있다고 강조했다.

ALE-에이전트는 현재 비공개 기술로, 사카나 AI는 기술 고도화와 기업 대상 개념 검증(PoC)에 집중하고 있다.

동시에 장기적으로는 목표 기준 자체를 에이전트가 스스로 정의하는 '자기 재작성(self-rewriting) 에이전트'를 연구 중이다. 이는 인간조차 명확한 기준을 세우기 어려운 문제 영역까지 AI의 활용 범위가 넓어질 수 있다는 것을 의미한다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1김도영 연봉 삭감
    김도영 연봉 삭감
  2. 2전광훈 구속 유지
    전광훈 구속 유지
  3. 3장동혁 단식투쟁
    장동혁 단식투쟁
  4. 4한화 김기태 코치
    한화 김기태 코치
  5. 5조정석 거미 득녀
    조정석 거미 득녀

AI타임스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD