2024.03.10 (일)

  • 맑음동두천 9.9℃
  • 맑음강릉 10.7℃
  • 맑음서울 8.9℃
  • 맑음대전 10.4℃
  • 맑음대구 10.8℃
  • 맑음울산 10.5℃
  • 맑음광주 10.8℃
  • 맑음부산 11.2℃
  • 맑음고창 10.5℃
  • 맑음제주 11.3℃
  • 맑음강화 7.1℃
  • 맑음보은 9.3℃
  • 맑음금산 9.6℃
  • 맑음강진군 11.9℃
  • 맑음경주시 11.7℃
  • 맑음거제 11.4℃
기상청 제공
월간구독신청

SAT 사례를 통해 본 수능 절대평가와 상대평가의 문제



김재춘 한국교육개발원 원장


일전에 교육부는 2021학년도 수능 개편 안으로 4과목 절대평가 방안(1안)과 전 과목 절대평가 방안(2안)을 제안하였다. 두 방안에 대해 거센 비판이 일어나자 교육부는 수능 정책 확정을 1년간 유예하는 결정을 내렸다. 이 사태는 우리 사회에서 수능이 많은 사람의 관심을 받고 있을 뿐만 아니라 수능정책이 우리 교육에 미치는 영향이 그만큼 크다는 사실을 여실히 보여주었다.


필자는 교육부가 수능 정책 결정을 1년 유예한 것이 그나마 다행이라고 생각한다. 왜냐하면, 상대평가였던 수능을 절대평가로 바꾸는 작업은 우리나라 교육의 성격과 방향을 새로 설정하는 것만큼이나 중요한 작업이기 때문이다. 따라서 수능 개편작업은 단순히 절대평가를 어느 정도로 도입할 것이냐는 정도의 문제로 다루기보다는 대입전형의 전반적인 문제를 포함하여 미래 우리 교육의 성격과 방향까지도 검토하는 문제로 다루어져야 하기 때문이다.


미국 수능에 해당하는 SAT에 대해 잠깐 살펴보자. 전통적으로 미국에서는 학생이 진학을 희망하는 대학에 직접 가서 입학시험을 치러야 했다. 이런 불편함을 줄이고자 1900년에 만들어진 대학연합체인 대학협의회는 국가 차원에서 실시되는 논술시험을 만들었다. 이 시험으로 대학협의회 소속 대학의 대학별 입학시험은 사라지게 되었다.


그러나 1920년대에 미국대학협의회는 우수학생을 선발하는데 쉽게 활용할 수 있는 IQ검사와 유사한 형식의 학업적성검사(SAT)라는 객관식 시험 개발에 착수했다. 1926년에 처음 치러진 SAT는 대학에서 학업을 수행할 지적 능력이 있는가를 평가한다는 점에서 ‘학업적성검사’라고 명명되었다. 1930년대까지 SAT는 부차적 성격의 시험으로 논술시험으로 뽑기 어려운 학생을 선발하거나 장학생을 뽑는 데에 주로 활용되었다.


태평양대전을 계기로 아이비리그 대학 총장들이 한시적으로 SAT 시험으로 학생을 선발하던 것이 굳어지면서 SAT가 미국에서 유일한 대학입학시험이 되었다. 2차 세계대전 이후 객관식 시험의 기계채점이 가능해지고, G. I. Bill의 영향으로 퇴역군인들의 대학진학이 급증하고, 대학협의회가 SAT를 전담할 ETS를 설립하면서 SAT는 미국의 대표적인 대학입학시험으로 위상을 굳혀갔다. 오늘날의 미국 SAT의 기본 골격은 1941년을 전후하여 만들어졌다고 볼 수 있다.


SAT는 정상분포라는 규준(norm)을 설정하고, 이를 근거로 학생의 점수를 부여한다는 점에서 상대평가에 가깝다. SAT는 매번 학생의 점수를 평균 500점, 표준편차 100점으로 환산해서 대부분의 학생들이 200점부터 800점 사이에 위치하도록 설계되었다. 특히 1941년에는 10,600명의 시험점수 분포를 규준으로 삼고, 이후의 모든 SAT 점수는 이 규준에 근거하여 부여하였다. 이를 전문용어로 규준기반평가라고 한다.


즉, SAT 시험 보는 학생은 1941년에 SAT 시험을 치른 약 1만명의 학생들의 점수 분포에서 어디쯤 위치하는가에 따라 자신의 점수를 부여받았다. 그런데 SAT 시험점수 평균이 지속적으로 낮아지자 1995년에 새로운 규준을 만들었다. 이 규준은 1990년에 시험을 치른 약 100만명의 학생들의 SAT 시험 점수를 토대로 평균 500, 표준편차 110으로 하는 규준이다. 오늘날 SAT 시험 보는 학생은 1990년에 시험을 치른 100만 명 학생의 점수 분포에서 어디쯤 위치하느냐에 따라 자신의 점수를 부여받는다.


SAT는 우리나라 수능과는 달리, 세련된 상대평가를 채택하고 있다. 우리나라 수능은 전체 학생 중 어디에 위치하느냐에 따라 점수나 등급이 부여된다. 따라서 내 반 친구가 나보다 더 좋은 등급을 받으면 나는 상대적으로 더 낮은 등급을 받을 수밖에 없다. 이처럼 수능이 사실상 내 친구들과 경쟁시험이라는 점에서 거친 상대평가라고 말할 수 있다.


그러나 SAT는 1941년 또는 1990년을 기준삼아 만든 규준으로 점수를 부여하기 때문에 친구의 SAT 점수가 나의 점수나 등급에 어떠한 영향도 미치지 않는다. 둘 다 열심히 공부하면 기준년도 규준에 비춰 좋은 점수를 얻을 수 있기 때문이다. SAT는 친구와 경쟁하기보다는 함께 열심히 공부하면 둘 다 모두 원-원 할 수 있는 세련된 상대평가 시험이다.


더 나아가 SAT는 여러 번 치러지는 SAT 점수간에 의미 있는 비교를 가능하게 해준다. SAT의 경우 1941년 이후부터는 기준년도인 1941년 또는 1990년도에 치러진 SAT 시험과 이후 모든 SAT 시험을 연계시켜 즉 전문용어로 동등화하여 각 SAT 시험점수간의 비교를 가능하게 하였다. 그 결과, 한 해에 여러 번 치른 SAT 점수를 신뢰롭게 비교하여 활용하는 것이 가능해졌을 뿐만 아니라 매년 치르는 SAT 점수를 상호 비교할 수 있게 되었다.


예컨대, 2002년에 530점을 받았던 언어 점수와 2012년에 499점 받은 언어점수를 비교하여, 학생들의 언어 실력이 떨어졌다고 말할 수 있다. 이런 성적 차이는 시험 보는 학생들의 실력 차이 때문에 나타난 것으로 해석가능하다. 왜냐하면, 2002년과 2012년 점수 모두 1990년에 시험 본 학생들의 점수 분포, 즉 규준에 근거한 점수이기 때문이다. 그러나 우리나라 수능은, 매년 수능시험 간에 동등화 작업이 없는 (난이도가) 다른 시험을 치르며, 그 결과, 여러 해에 걸쳐 치러진 수능점수를 의미 있게 비교할 수 없다.


수능시험을 상대평가에서 절대평가로 바꾸는 작업은 우리교육의 성격과 방향을 바꾸는 작업에 해당한다. 따라서 수능을 절대평가로 전환하는 문제는 일부과목에서만 절대평가로 전환할 것인가 아니면 모든 과목에서 절대평가로 전환할 것인가와 같은 전환 범위의 문제로 축소되어서는 곤란하다. 크게는 우리교육의 성격과 미래 방향을 어떻게 설정할 것인지, 대입전형은 어떻게 바꾸어야 할 것인지, 수능을 SAT처럼 규준기반평가로 할 것인지, 응시기회는 여러 번 줄 것인지, 논술시험을 포함할 것이지, 대학수학능력을 평가할지 아니면 고등학교 학업성취도를 평가할지 등에 대한 종합적인 검토가 필요해 보인다.


더 나아가 수능시험은 많은 사람들의 커다란 이해관계가 걸려있는 시험이다. 수능시험의 영향으로부터 자유로운 사람은 거의 없다고 볼 수 있다. 따라서 수능시험 개선과 관련한 논의는 열린 상태로 이루어질 필요가 있다. 소수의 전문가가 수능 개선안을 마련한 후 형식적인 공청회를 거치는 과거 방식에서 과감히 탈피할 필요가 있다. 수능을 상대평가에서 절대평가로 전환하는 문제는 우리 교육의 중요한 문제이기 때문에 최근 등장한 공론화 방식을 채택하여 사회적 합의를 이루는 것도 한 가지 대안일 수 있다. 수능 개선안은 열린 논의를 통해 많은 사람들이 참여하는 집단지성에 의해 마련되는 것이 더 바람직해 보인다.



학력 | ~ 1986 서울대학교 사범대학 교육학과(B.A.)
~ 1988서울대학교 대학원 교육학과(M.A.)
~ 1996미국 University of California, Los Angeles 교육학과(Ph.D.)


주요 경력 |
OECD CERI(교육연구혁신센터) 운영위원
유네스코 한국위원회 운영위원 및 교육분과위원회 위원장
교육부 정책자문위원회 학교교육개혁분과 위원장
제58대 교육부 차관
대통령비서실 교육문화수석실 교육비서관
세계교과서학회 아시아대표이사
영남대학교 교육학과 교수


since 1995 대한뉴스 홈페이지 http://www.daehannews.kr에서 더 많은 기사를 볼 수 있습니다.




배너