교육학 자료

[스크랩] 평가의 종류

산과 물 2007. 3. 5. 17:10

 교육평가의 종류는 두가지 차원에서 구분한다. 하나는 교육 진행 과정에 의하여 교육 계획 수립전에 진단평가, 교육과정 중의 형성평가, 교육이 끝난 후 종합적인 총합평가이며, 다른 하나는 무엇을 참고하느냐에 따라 규준참조평가와 준거참조평가로 나뉜다.

 

   1) 진단, 형성, 총합평가

   교육의 행위를 크게 3단계로 구분할 수 있으며, 첫째, 교육이 시작되기 전단계, 둘째, 교육이 진행되는 단계, 세째, 교육이 모두 끝난 단계이다. 그러므로 교육평가는 이 세 단계마다 모두 실시할 수 있다. 그럼으로 교육의 전체 맥락에서 교육평가를 진단평가, 형성평가, 총합평가로 나눈다.

   진단평가(d i a g n o s t i c  e v a l u a t i o n)는 교수-학습이 시작되기 전 학생이 소유하고 있는 특성을 체계적으로 측정하는 행위이다. 진단평가의 목적은 학생들의 능력과 특성을 사전에 파악하여 교육목표및 계획을 수립하는 데 참고하기 위함이다. 예를 들어 학생들이 수업하고자 하는 내용을 어느 정도 알고 있는지의 지적 시발 단계뿐 아니라 어떤 목적을 지니고 있으며 적성과 흥미의  수준이 어떤지를 파악하여야 한다. 그리고 진단평가의 결과에 의하여 학생들에게 적절한 교육목표뿐 아니라 교수법을 투입할 수 있다. 학습의 극대화를 위하여 진단평가 결과로 학생들을 분류 배치하는 것이 때로는 바람직하다. 물론 이때 평가의 결과에 의하여 학생들에게 표식을 다는 행위를 삼가하여야 하고 각 능력 수준에 적절한 교수법을 투입하기 위하여 사용되어야 한다. 또한 가정환경, 사회경제적 지위등도 진단평가의 요인이 될 수 있다.

   형성평가(f o r m a t i v e   e v a l u a t i o n)는 수업이 진행되고 있는 유동적인 상태에서 교육의 행위가 계획한 대로 진행되고 있는지를 확인하는 행위이다. S c r i v e n ( 1 9 6 7 )은 형성평가는 교육과정을 개선시키기 위한 평가로 정의하였다. 이는 교수-학습중에 학생들에게 송환 효과를 주어 학습의 극대화를 꾀하고, 교수전략이나 교육과정을 일시적으로 개선할 수 있다. 교수 학습중에 가르치고 배우는 내용을 얼마나 잘 이해하고 있는지를 수시로 점검하므로서 학생들의 수업능력, 태도, 학습방법을 확인할 수 있으며, 교수법중 어느 단원에서 어려움이 있는지를 간파할 수 있다. 이런 과정을 통하여 교육과정을 개선하고 교재, 교구등의 적절성을 수시로 확인할 수 있다.

   일반적으로 형성평가는 교사들이 주체가 되며 형식적인 평가는 물론 비형식적인 평가의 형태를 지닌다. 형성평가 역시 학생들의 평가 결과를 서열화하는 데 흥미를 두기 보다는 가르친 내용을 얼마나 알고 있느냐에 관심을 두므로 준거참조평가 형태를 추구한다. 그러므로 형성평가를 실시하기 위하여 제작하는 검사는 학습에서 중요한 내용을 모두 포함하고, 다양한 문항형식에 의하여 적절한 수준의 문항난이도를 유지하며, 학생들이 잘못 이해하는 부분을 묻는 질문을 포함하여야 한다.

   총합평가( s u m m a t i v e   e v a l u a t i o n)란 교수-학습이 끝난 다음 교수목교 달성, 성취 여부를 종합적으로 판정하는 평가 형태를 말한다. S c r i v e n ( 1 9 6 7  )이 총합평가란 교육과정의 총체(c u r r i c u l u m   p a c k a g e ) 가 충분할 만큼 중요한 교육적 진보를 가져왔는지를 확인하는 행위라 하였다. 총합평가는 자격증 부여의 결정이라든지 점수 판정에 의한 당락 결정, 점수 판정에 의한 서열화, 그리고 집단간 비교등의 목적을 지니고 있으므로 교사이외에 교과전문가, 교육과정 전문가, 교육평가 전문가들이 공동 참여하여 실시하고 있다.

 

   2) 규준과 준거참조평가

    규준참조평가는 상대비교평가로, 준거참조평가는 절대평가로 알려져 있다.

   규준참조평가(n o r m - r e f e r e n c e d   e v a l u a t i o n )란 학생이 무엇을 얼마만큼 알고 있느냐에 대한 관심보다는 개인의 성취 수준을 비교 집단의 규준에 비추어 상대적 서열을 판단하는 평가 형태이다. 즉 어떤 학생의 성취가 상위에 있는지 혹은 하위에 있는지에 관심을 두므로 등위나 퍼센타일로 표현한다. 예를 들어 어떤 학생의 대학수학능력시험 점수가 1 7 0점일 경우 이에 해당하는 등위가 상위 4 % 일 때, 만약 상위 4 %라는 정보가 의사결정에 보다 중요한 기능을 하였다면 규준참조평가가 적용된 것이다. 현재 까지 우리나라 대학입시제도는 규준참조평가의 틀을 벗어나지 못하는 대표적인 예이다.

   규준참조평가의 가장 중요한 단어로 규준( n o r m )이란 원점수의 상대적 위치를 설명하기 위하여 쓰이는 자로서 모집단을 대표하기 위하여 추출된 표본에서 얻어진 평균점수와 표준편차로 만들어 진다.

   규준참조평가의 장점은 개인의 성취수준에 대한 상대적 서열을 파악하므로 우열 구분이 용이하여 상호 경쟁을 위한 동기를 유발할 수 있으나 그에 못지 않은 많은 단점이 있다. 단점으로 첫째, 서열에 의한 정보를 중시하므로 원점수가 지니고 있는 많은 정보를 상실한다. 둘째, 교수이론에 부적절하다. 무엇을 얼마만큼 알고 있는지에 관심을 두지 않음로 교육목표, 교육과정, 교수방법, 학습효과등을 경시하는 경향이 있다. 교육행위 자체의 중요한 부분이 간과될 수 있다. 세째, 인간교육의 상실이다. 상호경쟁이 강조되므로 상호 협동보다는 경쟁을 당연한 윤리로 받아 들일 수 있게 된다. 특히 초 중등학교 시절의 이같은 평가체제는 성인이 된 후 인격 형성에도 영향을 주어 사회 생활에서도 타인과 같이 무엇을 공유하는 행위를 하지 못할 가능성이 높다. 또한 서열주의 의식 팽배로 규준참조평가에서 상위 서열의 경험을 자주 한 사람은 우월의식을, 하위 서열의 경험을 자주 갖은 사람은 열등의식을 갖게 된다. 또한 경쟁심 고취, 특히 남보다 조금이라도 서열이 높아야 한다는 강박관념에 따르는 초조함, 그리고 이기심등은 올바른 인격 형성을 저해하는 요인이 될 수 있다. 네째, 암기 위주의 교육을 조장한다. 지적인 탐구력을 강조하여 문제를 해결하려는 시간적 여유가 없을 경우, 아니 그런 능력을 배양시키기 어려운 경우, 높은 점수를 얻기 위하여 무조건 외우는 교육을 실시할 수 밖에 없다.

   규준참조평가는 이상의 단점 못지 않게 학문적 결함을 지니고 있다. 첫째, 무엇을 얼마 만큼 아느냐에 관심이 소흘하기 때문에 무엇을 어떻게 얼마만큼 가르치고 배워야 하느냐에 대한 시사와 기준이 없다. 둘째, 규준을 만들기 위하여 사용된 검사들이 정말로 교과내용과 교육목표를 잘 포함하고 있느냐의 문제이다. 만약 어떤 검사가 교육과정이나 교육내용과 관련이 먼 문항들로 구성되었을 때, 그평균 점수와 표준편차가 무슨 의미가 있느냐는 것이다. 더군다나 그 평균점수와 표준편차에 의한 %,  Z점수, T점수는 무용지물이 된다. 세째, 규준을 만들기 위하여 모집단을 대표하는 표본을 추출하였을 때, 표본이 모집단을 대표하였느냐의 문제이다. 만약 표본이 모집단을 대표하지 못하였다면 표본에서 얻은 점수에 의하여 피험자의 상대적 서열을 나타내는 정보는 그릇된 정보일 수 있다.

   규준참조평가의 여러가지 단점과 학문적 결점이 있음에도 불구하고 상대비교평가 체제가 필요에 의하여 요구될 때 검사 제작은 다음과 같은 규칙을 갖는다. 첫째, 다양한 난이도 수준의 문항을 제작한다. 매우 쉬운 문항 부터 매우 어려운 문항까지 제작하여야 피험자의 능력 점수가 매우 낮은 점수부터 높은 점수까지 얻게 된다. 둘째, 문항변별도가 높은 문항을 제작한다. 문항의 변별도가 높아야 피험자를 능력에 따라 매우 다양한 점수를 얻게 된다.

   준거참조평가는 규준참조평가와 같이 이론적 관점에서 제안되었으나 규준참조평가와 다른 목적을 지니고 있으며, 규준참조평가가 지니고 있는 많은 단점을 보완한다. 준거참조평가( c r i t e r i o n - r e f e r e n c e d   e v a l u a t i o n )란 학습자 또는 개인이 무엇을 얼마만큼 알고 있는지를 재는 평가로서 무엇이라함은 학습자가 성취하여야 할 과제나 행위의 영역 혹은 분야를 말한다. 쉽게 말하면 학습자 또는 개인이 정해진 준거 혹은 목표에 도달하였는지 여부를 판단하는 평가 형태를 말한다. 그러므로 준거참조평가는 정의된 영역과 준거가 필수적이다. 준거참조평가를 준거지향평가, 목표참조평가, 혹은 목표지향평가라 한다.

   준거참조평가의 필수적 요소인 잘 한정된 영역은 학습자가 배워야 할 내용의 영역으로서 수학에서는 미분, 적분, 확률등을, 국어에서는 소설, 희곡, 고전 문학등을 들 수 있다. 다른 요소인 준거( c r i t e r i o n ,   c u t - o f f ,   s t a n d a r d )는 규명된 영역에서 교육목표의 달성 여부를 판단하는 기준을 말한다. A E R A ,   A P A ,   N C M E ( 1 9 8 5  )는 준거란 피험자가 어떤 일을 수행할 수 있다고 확신하는 지식 혹은 기술의 수준을 말한다.

   준거참조평가의 예로 의사고시, 약사고시등의 자격고시를 들 수 있다. 준거참조평가에서 쉽지 않은 부분은 준거를 설정하는 것이다. 준거의 설정은 전문가들에 판단에 의하므로 주관적일 수 있으나 임의적이지는 않다. 준거를 설정하는 방법으로 A n g o f f  방법(1 9 7 1 ) 과  J a e g e r 방법( 1 9 7 8 ) 등이 있다.

   준거참조평가의 장점으로 첫째, 교수 학습이론에 적절하다. 무엇을 알고 모르는지의 직접적 정보를 제공하므로 무엇을 어떻게 가르칠 것인가를 시사한다. 둘째, 교육목표, 교육과정, 교수법등의 개선이 용이하다. 세째, 상대비교에 치중하지 않으므로 탐구 정신을 발휘할 여유가 있으며 이로 인하여 지적 성취감을 맛볼 수 있다. 충분한 시간에 의하여 이해, 비교, 분석, 종합등의 고등정신을 배양할 수 있으며, 새로운 사실을 창안할 수 있는 장점이 있다. 네째, 인성교육이 가능하다. 상호 협동에 의하여 공동생활을 영유할 수 있을 뿐 아니라 지적 계급 서열화 의식을 탈피할 수 있다. 또한 평가가 남보다 우월한지를 비교하는 목적이 있는 것이 아니라 준거 달성에 관심이 있으므로 강박관념, 이기심, 질투심이 발생하지 않아 정신 건강에 이롭다.

   준거참조평가의 단점으로 준거 설정이 문제될 수 있으며, 상호 경쟁을 통한 외적 학습동기 유발이 곤란하다고 지적하나 큰 단점으로 볼 수 없음이 필자의 의견이다.

   준거참조평가는 상대 서열 비교에 관심이 있는 것이 아니라 준거 혹은 목표에 도달하였느냐를 판정하므로 검사도구 제작에서 다소 다른 규칙을 적용한다. 첫째, 다양한 난이도 수준의 문항보다는 준거에 준하는 수준의 난이도 문항을 제작한다. 둘째, 변별력이 높은 문항을 제작한다. 세째, 규정된 영역에서 중요한 내용을 출제한다. 준거참조평가란 규정된 영역에서 알아야 할 내용을 얼마만큼 알고 있나를 평가하므로 학습 내용중 중요한 내용을 측정하여야 한다.

   규준참조평가와 준거참조평가는 동시에 제안되었으나 목적이 상이하므로 시대적 상황에 따라 두 평가 중 규준참조평가 혹은 준거참조평가가 중요시 되어왔다. 일반적으로 규준참조평가인 상대비교평가가 쉽게 적용되었으나 그 폐단을 경험한 사회는 교육적 견지에서 준거참조평가로 전환하고 있다.

 

                                                                                  출처: 교육평가의 새로운 동향     성 태제(이화여대  교수)

출처 : 교육학과 함께하는 교육
글쓴이 : 기가 원글보기
메모 :