지난 13일 진행된 2026학년도 수능은 "작년보다 불수능이었다"는 반응과 "체감은 비슷했다"는 평가가 뒤섞였다. 진학사를 비롯한 입시업계는 이번 수능을 두고 "전반적으로 지난해보다 다소 어렵게 출제됐다"고 총평했다.
디지털데일리는 오픈AI의 최신 언어모델 'GPT-5.1 씽킹(Thinking)'을 활용해 2025·2026학년도 수능 국어·영어·수학 세 과목 난이도를 비교했다. 시험지 구조와 문항 데이터를 분석하고 국내 입시기관·언론의 난이도 평가와 얼마나 맞아 떨어지는지 살폈다.
◆AI, 시험 점수 아닌 '시험지 자체'를 분석
오픈AI의 'GPT-5.1' 모델은 기존 GPT-5의 고도화된 버전이다. GPT-5.1 인스턴트(적응형 추론), 오토(상황에 맞게 자동 선택)과 함께 세부 종류 중 하나인 GPT-5.1 씽킹은 GPT-5 씽킹보다 사고 시간 분포를 유연하게 조절해 복잡한 문제를 더 깊게 사고한다.
어려운 작업을 부여하면 2배 느리게 사고 시간을 배분한다는 특징이 있다. 같은 기본 모드(스탠다드) 상태에서도 문제 난도에 따라 처리 속도가 달라진다.
이번 실험에서는 2025·2026학년도 수능 국어·수학·영어 영역 문제지와 정답표, 진학사·EBS·유웨이·종로학원 등이 발표한 난이도 총평·예상 1등급 컷·1등급 비율 분석 기사, 수험생 설문 결과와 교사·입시전문가 인터뷰 등 체감 난이도 관련 2차 자료를 입력했다.
GPT-5.1 씽킹은 사람처럼 시험을 치르는 대신 지문·조건의 분량, 문항 구조, 배점과 고난도 문항 분포, 외부 난이도 분석 기사 내용을 함께 고려했다. 2025년도와 비교해 어느 과목에서 어떤 방식으로 난도가 변했는지 분석했다.
올해 국어 영역은 EBS 분석 기준 작년과 전체 난이도는 유사하나 독서 지문이 다소 어렵게 출제돼 변별력이 높아졌다는 평가를 받았다. 입시기관들은 표준점수 기준 1등급 컷을 132~133점 수준으로 제시했다. 지난해(2025학년도)보다 소폭 상승한 수치다.
GPT-5.1 씽킹 분석 결과도 비슷한 방향을 가리켰다. 출제 구조는 동일했다. 비문학–화법·작문–문학 구성과 문항 수, 배점 체계는 큰 변화가 없었다.
다만 공통과목(독서)에서 개념·용어 밀도가 증가했다. 2026학년도 독서 지문은 추상 개념을 구분하는 유형이 늘어나 단순 정보 확인보다는 개념 간 관계를 파악해야 하는 문항 비중이 높았다. 여러 조건을 동시에 고려해야 하는 준킬러 문항도 공통과목 중심으로 늘어났다.
◆수학, 공통·확통에서 조건 늘어 '조금 더 어렵게'
수학 영역도 논쟁의 중심에 섰다. 유웨이와 대학저널 등은 "국어·수학이 지난해보다 전반적으로 어렵게 출제됐다"고 평가했다. EBS는 표준점수 기준 1등급 컷을 131점으로 제시해 작년과 비슷하거나 소폭 상승한 수준으로 봤다.
GPT-5.1 씽킹 분석에 따르면 배점 구조·킬러 문항 수는 2025년과 유사했다. 극상위권을 가르는 킬러 문항의 양적 비중은 유지됐다.
다만 공통 과목과 확률과 통계 선택 문항에서 상황 설명 문장과 조건 개수가 늘어난 문제가 다수 포착됐다. GPT-5.1 씽킹은 "상위 문항의 순수 수학적 난이는 지난해와 비슷하지만 공통·확통에서 정보량이 늘어나 실제 시험장에서 느끼는 난도는 조금 더 어렵다"고 분석했다.
◆영어 1등급 비율 감소…읽기 파트 난도 '확실히 상승'
영어 영역은 절대평가 과목인 만큼 1등급 비율이 난이도를 가늠하는 핵심 지표로 쓰인다. 지난해 1등급 비율은 6.22%였으나 올해는 입시기관에 따라 5~6% 혹은 3.8% 수준까지 낮아질 수 있다는 전망이 나왔다.
GPT-5.1 씽킹은 듣기(1~17번)는 전년과 거의 동일한 난도로, 읽기(18번 이후)에서 난도 상승이 뚜렷하다고 분석했다. 칸트·홉스 등 철학과 경제·기술 분야 등 추상적·전문적 소재 지문이 늘었고, 빈칸 추론·문장 삽입·글의 순서 등 상위권 겨냥 문항에서 지문 길이와 정보량이 증가했다.
결론적으로 AI가 본 구조적 난도 분석과 수험생·입시업계의 체감 난이도 평가는 큰 틀에서 일치했다.
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -




























































