If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

공정한 무작위 추출을 하기 위한 방법

공정한 무작위 추출을 하기 위한 방법.

동영상 대본

여러분이 학교를 운영하고 있고 그 학교에는 학생들이 이만큼 있다고 가정해 봅시다 이것이 모집단입니다 이 학생들이 학교 수학 교육의 질에 대해 어떻게 생각하는지를 알고 싶어서 설문조사를 만듭니다 그리고 이 설문조사를 누구에게 줄 것인지를 정해야 합니다 그리고 이 설문조사를 누구에게 줄 것인지를 정해야 합니다 한 가지 방법은 모집단의 모든 사람에게 가는 것이지만 매우 큰 학교라고 합시다 그 학교가 대학교이며 10,000명이 속해 있다고 가정합시다 그러면 모두에게 부탁할 수는 없을 것입니다 대신에 이 모집단에서 표본을 추출해서 학교 전체의 견해에 대한 어림값을 얻기로 합니다 그러니 표본을 추출해 봅시다 이 모집단에서 표본추출을 할 것입니다 응답 결과에 편향이 생기는 것을 방지하기 위해서는 그러니까 모집단 전체를 제대로 대표할 확률을 높이기 위해서는 그러니까 모집단 전체를 제대로 대표할 확률을 높이기 위해서는 임의로 표본을 추출하여야 합니다 표본은 임의일 수도 있고 임의가 아닐 수도 있습니다 임의가 아닐 수도 있습니다 처음에는 임의로 표본추출을 하는 것이 꽤 간단해 보일 수도 있겠지만 실제로 뜯어보면 항상 그리 간단하지만은 않습니다 임의의 표본의 한 종류로는 단순확률 표본이 있습니다 임의의 표본의 한 종류로는 단순확률 표본이 있습니다 임의의 표본의 한 종류로는 단순확률 표본이 있습니다 이는 어떻게 하는 것이냐면 학교의 모든 사람에게 각각 숫자를 부여합니다 이미 학번 같은 것이 있을 수도 있습니다 그리고 컴퓨터 같은 난수 발생기를 이용해 100명을 뽑습니다 이렇게 설문조사의 대상자가 될 100명의 학생들로 이루어진 표본이 만들어집니다 이것이 단순확률 표본입니다 이 모집단 전체에서 무작위하게 이것이 모집단이고 여기서 임의로 사람들을 뽑고 있습니다 임의라고 할 수 있는 이유는 난수 발생기나 수열 등으로부터 학생들을 뽑고 있기 때문입니다 학생들을 뽑고 있기 때문입니다 이는 꽤 좋은 방법입니다 이 표본에 편향이 존재할 가능성은 낮습니다 하지만 이런 경우도 생길 수 있습니다 어쩌다가 난수 발생기가 뽑은 표본에 남녀 성비 균형이 맞지 않거나 신입생의 비율이 너무 높거나 혹은 낮거나 공학도 대 영문학도의 비율 균형이 맞지 않을 가능성이 분명 존재합니다 그러니까 완벽히 임의의 단순확률 표본을 사용하고 있음에도 불구하고 이가 모집단 전체를 대표하지 못할 확률이 존재합니다 그래서 이 확률을 줄이기 위한 다른 방법들이 존재합니다 그래서 이 확률을 줄이기 위한 다른 방법들이 존재합니다 한 가지는 층화추출 표본입니다 한 가지는 층화추출 표본입니다 이는 모집단 전체를 계층화시키는 방법입니다 이는 모집단 전체를 계층화시키는 방법입니다 아까 썼던 것과 동일한 모집단을 여기서는 편의상 네모로 그리겠습니다 여기서는 편의상 네모로 그리겠습니다 이 모집단을 계층화할 것인데 1학년, 2학년 3학년, 4학년의 비율이 맞는 표본을 원한다고 합시다 1학년, 2학년, 3학년, 4학년으로 계층화한 후 각 집단에서 25명씩 추출합니다 이것들이 계층입니다 이것들이 각각 1학년, 2학년, 3학년, 4학년이고 모집단 전체에서 그냥 100명을 추출하는 대신 각각의 계층에서 25명씩 추출합니다 이렇게 말입니다 이 방식으로 하면 여러분의 대학 내에서 적어도 모든 나이대를 아우르는 답변을 받았음을 보장할 수 있습니다 다른 경우로는 학년 비가 맞는 것보다는 남녀 성비가 맞는 것을 더 중요하게 여길 수도 있습니다 그리고 만약에 100명을 임의로 뽑는다면 그리고 만약에 100명을 임의로 뽑는다면 50 대 50에 가까울 확률이 높긴 하겠지만 무작위성 때문에 남자 비율이 훨씬 높거나 여자 비율이 훨씬 높을 수 있습니다 이는 층화추출 표본에서도 일어날 수 있는 일입니다 그래서 이 경우에는 그래서 이 경우에는 군집추출 표본이라는 것을 사용할 수 있습니다 여기에 적겠습니다 군집추출 표본 집단을 추출하는데 이 집단들은 각각 이미 남녀 성비가 잘 맞습니다 이 집단들은 각각 이미 남녀 성비가 잘 맞습니다 예를 들어 모집단 전체에서 개개인을 추출하는 것 대신에 예를 들어 화요일과 목요일에 이것만 봐도 집단을 나누는 것이 결코 간단한 작업이 아님을 알 수 있지만 모집단을 교실에 따라 집단으로 나눌 수 있다고 합시다 그리고 각각의 교실에는 남학생과 여학생이 거의 동일한 수만큼 있다고 합시다 그리고 교실을 추출하는 것입니다 그래서 이는 군집추출이라고 합니다 그래서 이는 군집추출이라고 합니다 남녀 성비가 맞는 교실들을 집단으로서 추출하기 때문입니다 그러므로 전체를 잘 대표하지만 아직도 표본추출을 하고 있습니다 집단을 표본으로 추출하고 있지만 추출한 각각의 집단 각각의 교실에 있는 모든 사람들이 설문조사의 대상이 됩니다 이들은 모두 임의의 설문조사 임의의 표본추출의 종류입니다 단순확률 표본이 있고 계층화할 수도 있고 집단을 만든 다음 집단을 임의로 뽑아서 그 집단에 속한 모든 사람을 설문조사할 수도 있습니다 만약 이것들이 모두 임의의 표본들이라면 비확률 표본은 어떨까요? 비확률 표본추출의 예시로는 자발적 설문조사, 혹은 자발적 표본추출이 있습니다 자발적 설문조사, 혹은 자발적 표본추출이 있습니다 예를 들어 전교생에게 여기 웹사이트 주소가 있으니 관심 있으면 들어가서 설문조사를 해달라고 부탁하는 경우입니다 이는 편향을 유발할 가능성이 큽니다 왜냐하면 학교의 수학교육을 정말 좋아하는 학생들이 왜냐하면 학교의 수학교육을 정말 좋아하는 학생들이 설문조사에 응할 가능성이 더 높을 수도 있고 싫어하는 학생들이 응할 가능성이 더 높을 수도 있고 혹은 그냥 시간이 많은 학생들이 응할 가능성이 더 높을 수도 있습니다 그러므로 편향을 유발할 가능성이 높습니다 설문조사에 응하는 학생들은 단지 자원했다는 것만으로도 특정 방향으로 치우쳐 있을 수 있습니다 또 다른 비확률 표본으로는 편의 표본이 있습니다 편의성 때문에 편향이 유발되어서 이렇게 불립니다 예를 들어 처음으로 등교하는 100명을 표본으로 삼는 것입니다 이는 저에게 편리합니다 임의의 숫자를 쓸 필요도 없고 계층화나 집단 만들기를 하지 않아도 됩니다 하지만 이 경우에도 편향이 유발될 수 있음을 알 수 있습니다 왜냐하면 처음으로 등교하는 100명은 가장 성실한 학생들일지도 모르고 모두 매우 좋은 강사가 있는 이른 아침 수학 수업을 들을지도 모르기 때문입니다 혹은 반대가 될 수도 있습니다 그 수업의 강사가 별로여서 반대 방향으로 편향이 생길 수도 있습니다 그러므로 사람들이 자원하게 만들거나 첫 n명을 고르거나 그냥 어쩌다가 내 앞에 있는 학생들을 고르기로 한다면 편의상 앞에 있을 순 있지만 그것은 진정한 임의의 표본이 아닐 수 있습니다 편향이 유발될 수 있는 다른 요인들도 있는데 표본추출 방법이 문제가 아닐 수 있습니다 설문조사의 단어 선택 때문에 편향이 유발될 수도 있습니다 설문조사의 단어 선택 때문에 편향이 유발될 수도 있습니다 예를 들어 설문조사에 당신은 전 세계 대부분의 사람들이 접하지 못하는 수학교육을 받는 자신이 행운아라고 생각하십니까? 라고 되어 있다면 여러분이 스스로를 행운아로 생각하도록 편향시킬 수도 있습니다 여러분이 스스로를 행운아로 생각하도록 편향시킬 수도 있습니다 만약 단어 선택이 당신은 당신의 학교 학생들이 주변의 다른 학교들에 비해 대수학을 훨씬 많이 낙제한다는 사실을 좋아하십니까? 라고 되어 있다면 여러분이 부정적으로 편향될 수 있습니다 그러므로 설문조사에서 단어 선택은 매우 매우 중요합니다 이것에 따라 좌지우지될 수 있습니다 그리고 다른 것으로는 응답편향이 있습니다 응답편향이 있습니다 응답편향 이것은 사람들이 단순히 진실을 말하고 싶지 않아 하거나 아예 응답하고 싶지 않아 하는 경우입니다 어쩌면 학생들은 자신의 응답이 자신의 수학 교사나 행정직원들에게 공개될까봐 두려울 수도 있습니다 자신의 수학 교사나 행정직원들에게 공개될까봐 두려울 수도 있습니다 혹은 응답이 너무 부정적이라면 자신들에게 어떠한 피해가 돌아갈까 봐 두려울 수도 있습니다 그것 때문에 진실되지 않은 답변을 할 수도 있습니다 과도하게 긍정적으로 답하거나 아예 응답하지 않을 수도 있습니다 이 동영상은 표본추출에 관하여 어떻게 생각해야 하는지에 대해 살짝 훑고 지나가는 개요입니다 편향의 가능성을 줄이기 위해 임의의 표본추출을 하는 것이 좋습니다 이것들은 몇 가지 방법입니다 그리고 혹시 여러분이 편향을 유발할 가능성이 큰 이런 몇 가지 문제들을 일으키고 있지는 않은지 생각해보도록 합시다