ZetEngine은 학생부종합전형에서 지원자의 위치를 보다 정확하게 해석하기 위해 판단 모델을 지속적으로 개선하고 있습니다. 최근 우리는 실제 합격 사례를 바탕으로 모델의 학업성취도 평가 방식을 다시 점검했고, 그 과정에서 중요한 한계를 발견했습니다.
테스트에 사용한 사례는 평균 내신 4.3 수준이지만 학생부 기록이 매우 좋아, 연세대학교 실내건축학과 학생부종합 활동우수형에 실제로 합격한 학생의 사례였습니다. 기존 판단 모델에 이 사례를 입력했을 때 결과는 상향으로 나타났습니다.
당시 모델은 학생부 내용 자체는 긍정적으로 평가했지만, 연세대학교 실내건축학과 활동우수형 입시결과에서 확인되는 50%컷 2.03이라는 수치를 강하게 반영해 판단을 내린 것으로 보였습니다. 표면적으로만 보면 4.3의 평균 내신이 2.03컷 전형에 합격한 것은 쉽게 설명되지 않는 결과처럼 보입니다.
실제로 처음 모델이 내놓은 답변을 보면, 전공 적합성과 탐구력은 높게 보면서도 교과 성취도의 절대 경쟁력이 부족하다는 이유로 최종 판정을 상향으로 두고 있었습니다. 아래는 그 첫 번째 판단 결과를 정리해 넣은 것입니다.
Example
기존 모델의 상향 판단 응답
아래는 초기 모델이 연세대학교 실내건축학과 활동우수형 기준으로 해당 학생부를 평가했을 때 생성한 응답입니다.
이 의문을 바탕으로 학생부종합전형에서의 교과성적 해석 방식을 다시 연구했고, 그 과정에서 서울대학교 학생부종합전형 안내자료의 설명은 매우 중요한 기준이 되었습니다. 특히 서울대학교는 교과 성적을 해석하는 방식에 대해 아래와 같이 설명합니다.
서울대 인용글
교과 성적
교과 성적 지표는 학생의 학업역량을 판단할 수 있는 다양한 자료 중 하나입니다. 교과성취도를 파악할 때에는 교과 성적을 공식으로 수치화하여 기계적으로 반영하지 않습니다. 상이한 교육 환경과 교육과정에서 얻은 성취를 단순히 수치상으로 비교할 경우, 교과성취도는 지원자의 학업역량 수준을 판단하기 위한 정확한 정보가 될 수 없기 때문입니다. 정량평가를 하지 않으므로 학년별/과목별 반영 비율은 존재하지 않으며, 전 교과목의 3년간의 성취도를 정성적으로 평가합니다.
아래 표에서 볼 수 있듯이 수강자가 300명인 과목에서 1등급을 받은 성적과 수강자가 20명인 과목에서 3등급을 받은 성적을 단순히 비교하는 것은 적절한 평가방식이라 할 수 없습니다. 수강자 수, 원점수, 평균, 표준편차, 학년별 성적 변화, 선택 과목 특성 등의 다양한 정보를 통해 수치가 가지고 있는 의미와 정보를 정성적으로 해석하여 더욱 정확하게 학업역량을 평가하고자 합니다.
| 학년 | 학기 | 과목 | 이수단위 | 등급 | 인원 | 원점수 | 평균 | 표준편차 |
|---|---|---|---|---|---|---|---|---|
| 1 | 1 | ○○○ | 4 | 1 | 300 | 98 | 71.2 | 15.4 |
| 2 | 2 | ○○○ | 4 | 3 | 20 | 94 | 89.2 | 4.6 |
| 3 | 1 | ○○○ | 4 | A | - | - | - | - |
교과 성적을 평가할 때 학생이 이수한 과목의 선택 상황을 고려합니다. 소수 학생이 선택한 과목이나 난이도가 높은 과목을 이수하여 수치상 결과가 다소 나쁠 수 있지만 학생의 도전 정신과 호기심을 긍정적으로 평가한다면 도전하지 않은 학생에 비하여 더 좋은 평가를 할 수도 있습니다. 따라서 소규모 학교나 소수 학생들이 이수하는 과목을 수강하는 것이 서류평가에서 결코 불리하지 않습니다.
출처: 2026학년도 서울대학교 학생부종합전형 안내자료 발췌
이 설명은 우리가 마주한 사례를 이해하는 데 큰 힌트를 주었습니다. 평균 내신이 낮아 보이더라도, 어떤 과목을 선택했는지, 그 과목이 어떤 환경에서 운영됐는지, 성적의 맥락이 어떠한지에 따라 학업성취도의 해석은 전혀 달라질 수 있습니다. 다시 말해, 학생부종합전형에서의 학업성취도는 평균 등급이 아니라 성적이 만들어진 맥락 전체를 읽어야 더 정확하게 평가할 수 있다는 뜻입니다.
예를 들어 수강자가 매우 많은 과목에서 받은 높은 성취와, 소수 학생만 듣는 과목에서 받은 다소 낮은 등급은 같은 방식으로 비교하기 어렵습니다. 또 난이도가 높은 과목을 선택해 다소 불리한 수치가 나왔더라도, 그 선택 자체가 학생의 도전 정신과 학업적 호기심을 보여줄 수 있습니다. 학생부종합전형에서는 바로 이런 정보들이 점수 이상의 의미를 가집니다.
우리는 이 관점을 바탕으로 모델에 추가적인 학생부종합전형 학업성취도 평가방법프롬프트를 설계했습니다. 핵심은 단순 내신 평균을 직접 해석하는 대신, 교과성취도를 정성적으로 읽도록 유도하는 것이었습니다. 과목별 맥락, 선택의 난이도, 학년별 변화, 경쟁 환경, 전공 관련성 등을 함께 고려하도록 설계한 것입니다.
그 결과는 분명했습니다. 동일한 합격 사례를 다시 입력했을 때 기존 모델은상향이라고 판단했지만, 개선된 프롬프트를 적용한 뒤에는소신이라는 결과가 나왔습니다. 이는 실제 합격 사례와 훨씬 더 가까운 해석이었고, 모델이 학생부종합전형의 평가 방식을 이전보다 더 잘 반영하기 시작했다는 신호이기도 했습니다. 아래는 그 두번째 판단 결과를 정리해 넣은 것입니다.
Example
개선된 모델 응답 예시
아래는 학업성취도 해석 방식을 보완한 뒤, 연세대학교 실내건축학과 활동우수형 기준으로 다시 평가한 모델 응답입니다.
이 변화는 단순히 판정 단어 하나가 달라진 것 이상의 의미를 가집니다. 학생부종합전형에서는 학생의 학업역량이 숫자 하나로 환원되지 않습니다. 특히 전공 관련 과목 선택, 성취의 흐름, 정성적 기록과의 정합성까지 함께 보아야 하기 때문에, 모델 역시 그 구조를 따라가야 합니다. 그렇지 않으면 실제로는 충분히 경쟁력 있는 학생을 지나치게 보수적으로 해석할 수 있습니다.
이번 개선을 통해 우리는 학생부종합전형에서 모델의 학업성취도 평가를 한층 더 세밀하게 만들 수 있었습니다. 입시 결과의 숫자만을 단순 비교하는 방식에서 벗어나, 실제 입학사정에서 중요하게 다뤄지는 맥락적 해석을 더 깊게 반영할 수 있게 된 것입니다. 이는 곧 모델의 정확도를 높이고, 학생에게 더 설득력 있는 전략 판단을 제공하는 방향으로 이어집니다.
ZetEngine은 앞으로도 학생부종합전형의 실제 평가 논리를 더 정교하게 모델에 반영해 나갈 예정입니다. 우리의 목표는 단순히 결과를 예측하는 것이 아니라, 왜 그런 판단이 나오는지를 학생이 납득할 수 있도록 설명하는 것입니다. 그리고 그 설명이 실제 입시의 작동 방식과 가까울수록, 모델은 더 유용한 도구가 될 수 있다고 믿습니다.
Key insight
이번 개선에서 핵심이었던 판단 전환
평균 등급을 그대로 해석하는 방식에서, 학생부종합전형의 정성평가 구조를 반영하는 방식으로 모델을 수정했습니다.
Before
평균 내신과 입시결과 컷을 직접 비교해 학업성취도를 판단함.
예: 4.3 내신 vs 2.03컷 → 상향 판정
After
교과성적을 단순 수치가 아니라 맥락적 성취로 해석함.
- 수강자 수와 경쟁 환경
- 원점수, 평균, 표준편차
- 학년별 성적 변화 흐름
- 선택 과목의 난이도와 도전성
- 전공 관련 과목 이수의 정합성
- 학생부 기록과 성적의 연결성
예: 동일 사례 재판단 → 소신 판정
Why it matters
학생부종합전형의 학업성취도는 숫자 하나로 환산되지 않습니다. 따라서 모델 역시 단순 등급 평균보다, 성적이 형성된 구조와 맥락을 함께 읽을 수 있어야 실제 전형에 더 가까운 판단이 가능합니다.