서울대 모의논술 통계문제 해설
페이지 정보
작성자 논샘 작성일07-07-07 16:09 조회2,572회 댓글0건관련링크
본문
-
>> 서울대 인문계 모의논술 해설
※다음 제시문을 읽고 논제에 답하시오.
사람들은 대체로 수치를 정확하게 이해하고 사용한다. 예를 들어, 우리나라 국회의원 중 남자의 비율이 약 94%라고 했을 때 자신이 대한민국 남자이기 때문에 국회의원이 될 확률이 94%라 믿는 사람은 없다. 실제로 대한민국 남자가 국회의원이 될 확률은 아주 낮다. 그런데 2002년에 노벨상을 수상한 카네만(Kahneman)과 그의 동료들은 사람들이 수치를 정확하게 이해하지 못해 판단오류를 범하기도 한다는 것을 보여주었다. 이러한 판단오류는 교육을 잘 받은 사람에게서도 발생한다.
에이즈를 야기하는 바이러스(HIV)의 발병률이 0.1%라고 하자. 한 과학자가 HIV 보균자를 탐지할 수 있는 검사를 개발하였다. 그런데 이 검사 방법이 완벽하지는 않다. 이 검사에서 양성이 나오면 보균자로, 음성이 나오면 비보균자로 진단하게 된다. 이 검사는 HIV 보균자일 경우에 검사 결과가 100% 양성으로 나오지만, HIV 비보균자인 경우에도 양성으로 나올 확률이 5%가 된다. 만약 어떤 사람의 검사결과가 양성으로 나왔을 때, 이 사람이 HIV 보균자일 확률은 얼마일까? 이 질문에 대하여 대부분의 사람들은 95%라고 대답한다. 그러나 정답은 2%이하이다.
논제
제시문에서 정답이 2% 이하인 이유와 사람들이 95% 이상이라고 잘못 판단하게 되는 이유를 각각 설명하시오. (300자 이내)
논제 해설
이 문제를 다 읽고 나서 단번에 ‘수학I에서 배운 조건부확률 문제구나!’라고 느꼈다면 당신은 훌륭한 수학적 감각의 소유자이다. 이 문제의 본질을 정확히 꿰뚫어 본 것이다. 논제를 해결하기 위하여 제시문의 내용을 분석하고 정리해 보자.
‘우리나라 국회의원 중’ 남자의 비율과 ‘우리나라 사람 중’ 남자의 비율을 생각할 때 비율 산출의 기준으로 삼은 두 집단, 즉 ‘우리나라 국회의원 전체 집단’과 ‘우리나라 남자 전체 집단’을 혼동하는 사람은 거의 없다. 매우 친숙하고 일상적인 집단을 기준으로 비율을 산출하는 것이기 때문에 대부분의 사람들은 그 차이를 정확히 구분해 낸다. 그러나 조금 낯선 개념이나 친숙하지 않은 상황에 직면하게 되면 많은 사람들이 통계지표(비율, 확률)의 의미에 대한 혼동을 경험한다. 제시문의 내용을 계속 정리해 보자.
한 과학자가 개발한 HIV 보균자 탐지 검사는 완벽하지 않아서 다음과 같은 불완전한 정확도를 보인다. 보균자를 양성으로 진단할 확률은 100%, 음성으로 진단(오진, 誤診)할 확률은 0%이고, 비보균자를 양성으로 진단(오진)할 확률은 5%, 음성으로 진단할 확률은 95%이다. 그러나 이 자료만 가지고 어떤 사람의 검사 결과가 양성으로 나왔을 때, 그 사람이 정말로 HIV 보균자일 확률을 계산할 수 있는 방법은 없다. 그 조사 대상 전체 집단에 대한 HIV 보균자의 비율(즉, HIV의 발병률)을 모르면 아무런 계산을 해 낼 수가 없다. 즉 제시문 중에서 ‘에이즈를 야기하는 바이러스(HIV)의 발병률이 0.1%라고 하자’라는 문장을 삭제하면 답할 수 없는 물음이다. 독자의 이해를 돕기 위하여 HIV 보균자 탐지 검사의 정확도를 〈표 1〉에 나타내고, 이것을 검사 대상 전체 집단의 크기를 1천명으로 환산하여 〈표 2〉에 다시 나타내 보았다.
〈표 2〉를 보고 양성 반응자(50.95명) 중에서 실제 HIV 보균자인 사람(1명)의 비율이 <수식 1>과 같이 2%에도 미치지 못한다는 사실을 쉽게 이해할 수 있다. 이처럼 조사 대상 전체에 대한 보균자의 비율(발병률, 가중치)를 고려하면 올바른 결과가 나온다.
그러나 가중치를 고려하지 않았기 때문에 다음과 같은 오류(논제에서 언급하듯이 95%이상이라고 잘못 판단하는 오류)에 빠지기도 한다. 보균자는 100% 양성반응, 비보균자는 5%가 양성반응을 보이므로 전체 양성반응자의 비율(105%)에 대한 양성반응 보균자의 비율(100%)을 계산하여 <수식 2>와 같이 95.2%(이는 95% 이상이다!)라고 착각하게 되는 것이다. 이는 보균자와 비보균자 집단의 크기가 1:999로서 매우 큰 차이가 나는데도 불구하고 그 크기가 서로 ‘같다’고 보았기 때문에 발생한 오류이다.
또 한가지 오류(제시문의 끝부분에 나타난 95%라고 판단하는 오류)는 더욱 단순한 착각으로부터 발생한다. ‘비보균자’ 중의 양성반응자 비율이 5%인데, 역으로 ‘양성반응자’ 중의 비보균자 비율이 5%라고 착각하는 것이다. 이로부터 ‘양성반응자’ 중의 보균자 비율이 95%라는 잘못된 결론을 내리게 되는 것이다.
이렇게 조금 낯선 개념이나 상황에 대한 통계지표에 대하여 기준이 되는 집단을 혼동하거나 전체 집단의 분할 가중치를 고려하지 않아서 발생하는 오류 등은 많은 사람들이 경험한다. 따라서 어떤 통계 지표로부터 올바른 결론을 도출하려면 그 조사 대상 전체 집단을 분할하는 복수의 기준(위의 예에서 보면, 남자와 여자, 국회의원과 비국회의원, 보균자와 비보균자, 양성반응자와 음성성반응자 등)에 의하여 조사 대상 집단이 분할되는 전체 구조를 반드시 고려하여 추론해 나가야 한다.
글쓴이: 한석원
댓글목록
등록된 댓글이 없습니다.