If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

올바른 표본 추출하기

유효한 결론을 내기 위해서는 치우치지 않고 집단을 대표하는 표본이 필요합니다. 만든 이: 살만 칸 선생님

동영상 대본

시의회 의원인 켈리는 알고 싶어하죠 지역주민들이 제시된 학교구획변경안에 대해 어떻게 느끼고 있는지. 다음 중 어떤 설문 조사방법이 켈리 시위원으로 하여금 지역주민들의 그 제안에 대한 감정에 관해서 유효한 결론을 내리게 할까요? 그것들을 보기 전에, 우리는 먼저 알아야 합니다. 지역전체 주민이 그 제시안에 대해 어떻게 느끼는 지에 관한 타당한 결론을 내리려면 그녀는 대표유형(샘플)을 찾아야 합니다. 왜곡된 대표유형이 아니고 그녀의 지역의 보편적 표본을 구해야 합니다. 자, 이제 그녀의 선택을 봅시다. 그녀는 이웃들에게 물어봐야 할까요? 그녀는 구획변경안으로 특별히 이득을 볼 수 있는 지역에 살 지도 모릅니다. 또는 그 지역 구획변경안 때문에 손해를 보는 지역에 살 수도 있죠. 그러니 이웃주민들에 물어보는 것은 전체 지역을 대표하는 안이 될 수가 없겠죠. 그러므로 단순히 이웃에게 물어본다는 것은 이치에 안맞는 일입니다. Whispering Pines 퇴직자들의 모임에 물어볼까요? 그러면 또다시 지역에 의한 왜곡된 결론이 도출되겠죠. 그녀는 과다표집을 하고 있는 겁니다. 이번에는 그녀는 인구통계학의 특정 나이를 과다표집하고 있는 거죠. 중년 또는 젊은 거주자들과 의견이 매우 다를 수 있는 나이든 거주자들을요, 그렇니 이것도 정확하지 않겠죠? 200명의 지역거주자들에 물어봅시다. 무작의로 이름을 뽑아서요. 타당해 보이나요? 한 지역의 특정 과다표집이 될 확률이 있어 보이진 않습니다. 가장 타당성 있어보이는 대표유형이 될 것입니다. 200명의 표집단은 꽤 큰 사이즈인데요. 따라서 무작위 표집 절차는 중요합니다. 어디서 이 이름들을 가져와야 할까요? 이 방법은 꽤 합당하긴 한 건데요. 지역의 놀이터에서 계시는 한 그룹의 부모들에게 물어봅시다. 다시한번, 이건 이웃에게 묻는게 되겠지요. 이것은 또한 특정 인구의 표본 추출이기도 합니다. 이것은 학교에 대해 가장 관심을 자기는 표본집단이 될 겁니다. 하지만 그녀는 지역구획변경안에 대한 전 지역주민들의 생각을 알고 싶어합니다. 좀 전에 지역 놀이터였죠. 이 놀이터는 어쨋든 지역 전체 놀이터는 아닙니다. 따라서 저라면 이 표본을 구하지 않겠습니다. 한번 더 표본을 구해봅시다. 미미는 300명의 급우들에게 설문조사를 하려합니다. 곧 다가오는 선거에 회장으로 나폴레옹 다이나마이트와 블레어 월도프 중 누구들 결정했는지 미미는 오늘이 선거날이라면 어느 후보자를 찍겠냐고 물어보려고 합니다. 어떤 방법이 미미가 급우들한테 설문할때 유력후보자에 대한 유효값을 가질 수 있을까요? 블레어와 점심을 같이 먹고 있는 모든 친구들에게 물어볼까요? 안되죠. 그러면 블레어 선호도로 값이 왜곡되겠죠. 그것은 대표 표본이 아닙니다. 나폴레옹의 축구팀원들에게 물어볼까요? 안됩니다. 똑같은 이치입니다. 나폴레옹 선호 쪽으로 나오기 쉽습니다. 만일 나폴레옹을 안좋아한다면 나폴레옹을 반대하겠죠. 어느 쪽이든 표본 값이 왜곡됩니다. 모든 학생들의 이름을 모자 않에 넣고 50개의 이름을 제비뽑기 해보세요. 그 학생들에게 누구 이름을 적었는지 물어보세요. 이게 좋은 무작위 표본 추출로 보이는데요. 그것은 전 인원의 훌륭한 대표 표본이 될 겁니다. N 또는 B로 시작되는 이름의 모든 학생들에 물어보는 것은요? 이것도 무작위 표집으로 간주되어 집니다 그러나 명심하세요. N은 나폴레옹과 같은 첫철자를 가졌고 B는 블레어와 첫글자가 같습니다. 그게 공평하다고 말할 지 모릅니다. 각각의 철자를 위해 그렇게 한다고요. 하지만, 그 반에는 이름이 N으로 시작하는 10명의 학생이 있을 수 있습니다. 그리고 오직 두명의 B로 시작하는 이름의 학생이 있을 수도 있죠. 대표본을 구하지도 못하는데요. 것보다도 같은 철자로 시작하는 이름 각각과 비슷한 이름을 가진 사람들이 있을 수 있죠. 그래서 나 같은면 이렇게 하지 않을 겁니다. 모든 학생들에게 물어볼까요? 네.. 그게 좋을 수 있죠. 300명의 학생은 시간을 많이 잡아먹지는 않을 것 같으니까요. 모든 사람에게 물어보는 것 보다 더 나은 표본은 없습니다. 어떤 방법이 미미가 급우들한테 설문할때 유력후보자에 대한 유효값을 가질 수 있을까요? 꽤 좋은 결론입니다. 사람들의 마음은 바뀔 수 있습니다. 그렇니 설문자들의 답은 아직 확실한 회장으로 정한 결론은 아닌 거죠. 더 나은 표본 사이즈를 구할 수 없습니다. 전체 모집단보다요. 반의 각각의 학생들에게 숫자를 부여하세요. 그리고 컴퓨터 프로그램을 이용하여 1-300 사이의 50개의 무작위 숫자를 뽑아보세요. 이 학생들에게 물어보세요. 이것은 모든 학생들의 이름을 모자 속에 넣고 50명을 제비뽑기 하는 것과 흡사합니다. 그래서 저라면 이것을 하겠습니다. 타당해 보이니까요.