If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:6:17

표본비율 표본분포가 정규적인 경우

동영상 대본

이번 영상에서는 어떤 조건에서 표본비율의 표본분포가 정규분포를 따르는지 어떤 조건에서 표본비율의 표본분포가 정규분포를 따르는지 어떤 조건에서 표본비율의 표본분포가 정규분포를 따르는지 어떤 조건에서 이렇게 오른쪽으로 왜곡되는지 어떤 조건에서 이렇게 오른쪽으로 왜곡되는지 혹은 어떤 조건에서 이렇게 왼쪽으로 왜곡되는지 알아보려고 합니다 혹은 어떤 조건에서 이렇게 왼쪽으로 왜곡되는지 알아보려고 합니다 먼저 이야기 할 것은 일종의 경험적 법칙인데 먼저 이야기 할 것은 일종의 경험적 법칙인데 만약 취한 표본의 크기와 모비율의 곱이 10보다 크거나 같고 만약 취한 표본의 크기와 모비율의 곱이 10보다 크거나 같고 만약 취한 표본의 크기와 모비율의 곱이 10보다 크거나 같고 표본의 크기를 1에서 모비율을 뺀 값과 곱한 것이 10 이상이면 표본의 크기를 1에서 모비율을 뺀 값과 곱한 것이 10 이상이면 표본의 크기를 1에서 모비율을 뺀 값과 곱한 것이 10 이상이면 표본의 크기를 1에서 모비율을 뺀 값과 곱한 것이 10 이상이면 경험법칙을 따르면 표본분포는 경험법칙을 따르면 표본분포는 대략 정규분포 형태를 보인다고 할 수 있습니다 이를 명심하고 몇 가지 예시를 들어봅시다 첫 번째 예시는 에밀리아의 레스토랑에 대한 문제입니다 첫 번째 예시는 에밀리아의 레스토랑에 대한 문제입니다 에밀리아는 매일 귤 박스 50개를 배송 받는데 공급처에 의하면 전체 귤 중 12%가 너무 익어버렸다고 합니다 공급처에 의하면 전체 귤 중 12%가 너무 익어버렸다고 합니다 공급처에 의하면 전체 귤 중 12%가 너무 익어버렸다고 합니다 에밀리아는 표본으로 50개의 귤을 이용하여 매일 받는 귤 중 과하게 익어버린 귤의 비율을 확인해 보려고 합니다 매일 받는 귤 중 과하게 익어버린 귤의 비율을 확인해 보려고 합니다 공급자의 주장이 참이고 매일 받는 귤은 임의의 표본들이라 합시다 공급자의 주장이 참이고 매일 받는 귤은 임의의 표본들이라 합시다 이 때 매일 받는 귤 중 너무 익어버린 귤 비율의 표본분포는 어떤 모양일까요? 이 때 매일 받는 귤 중 너무 익어버린 귤 비율의 표본분포는 어떤 모양일까요? 이 때 매일 받는 귤 중 너무 익어버린 귤 비율의 표본분포는 어떤 모양일까요? 잠시 영상을 멈추고 스스로 문제를 풀어보기 바랍니다 잠시 영상을 멈추고 스스로 문제를 풀어보기 바랍니다 좋습니다 이제 시작해 보죠 매일 받는 귤 중 50개를 표본으로 삼을 것이므로 표본 크기 n은 50이 됩니다 매일 받는 귤 중 50개를 표본으로 삼을 것이므로 표본 크기 n은 50이 됩니다 매일 받는 귤 중 50개를 표본으로 삼을 것이므로 표본 크기 n은 50이 됩니다 전체 귤 중 과하게 익은 귤의 비율은 12% 즉 p = 0.12입니다 전체 귤 중 과하게 익은 귤의 비율은 12% 즉 p = 0.12입니다 이제 n × p의 값은 어떻게 될까요? n × p는 50 × 0.12인데 100 × 0.12 = 12이므로 그 절반인 50을 곱한 값은 6이 됩니다 그리고 이 값은 10 이하입니다 이는 앞서 이야기한 두 가지 조건 중 첫 번째 조건을 위반하므로 이는 앞서 이야기한 두 가지 조건 중 첫 번째 조건을 위반하므로 이 표본분포는 정규분포를 따르지 않을 것이라는 것을 알 수 있습니다 그렇다면 이제 답해야 할 질문은 어떻게 왜곡된 그래프가 그려질까 하는 것입니다 이에 대한 답을 구하기 위한 열쇠는 표본분포에서 얻어지는 표본비율의 평균값은 표본분포에서 얻어지는 표본비율의 평균값은 표본분포에서 얻어지는 표본비율의 평균값은 표본분포에서 얻어지는 표본비율의 평균값은 모비율의 평균값과 같아집니다 즉 12%가 되어야 합니다 이제 이를 그래프로 그려 봅시다 여기 오른쪽 구석에 그려볼게요 여기 이 지점이 50%이고 이 지점이 100%입니다 평균값은 대략 이쯤에 12%입니다 즉 많은 표본들이 이 12% 근처에 분포하겠죠 따라서 이는 오른쪽으로 편향되어있을 것입니다 굉장히 긴 꼬리를 이렇게 그려야 합니다 따라서 이 분포는 오른쪽으로 왜곡되어 있습니다 또 다른 예시를 들어 봅시다 닐슨의 조사 결과에 의하면 매 주 88%의 어린이들이 라디오를 청취한다고 합니다 n = 125의 임의의 표본 크기 즉 125 명의 어린이들을 표본으로 삼는다고 합시다 n = 125의 임의의 표본 크기 즉 125 명의 어린이들을 표본으로 삼는다고 합시다 이제 이 표본에서 라디오를 청취한 어린이들의 수를 구할 때 이제 이 표본에서 라디오를 청취한 어린이들의 수를 구할 때 표본분포의 모양은 어떻게 될까요? 표본분포의 모양은 어떻게 될까요? 이번에도 잠시 영상을 멈추고 스스로 답을 구해보세요 좋습니다 이제 n과 p를 먼저 알아보아야겠죠 표본 크기는 n = 125입니다 모비율 즉 매주 라디오를 청취한 어린이들의 비율은 모비율 즉 매주 라디오를 청취한 어린이들의 비율은 88%이므로 p = 0.88이 됩니다 이제 n × p를 계산해 봅시다 꼭 계산해 보지 않아도 125 × 0.88은 당연히 10 이상이 될 것입니다 125의 90%에 달하는 값이므로 100 이상이 될 것입니다 125의 90%에 달하는 값이므로 100 이상이 될 것입니다 즉 10 이상임이 자명하죠 따라서 첫 번째 조건은 만족합니다 두 번째 조건은 어떻게 되는지 알아볼까요? 125 × (1 - p)는 125 × 0.12 이므로 125 × (1 - p)는 125 × 0.12 이므로 125의 12%에 해당하는 값입니다 125의 10%가 벌써 12.5이므로 125의 12% 또한 당연히 10보다 클 것입니다 125의 10%가 벌써 12.5이므로 125의 12% 또한 당연히 10보다 클 것입니다 125의 10%가 벌써 12.5이므로 125의 12% 또한 당연히 10보다 클 것입니다 꼭 정확한 값을 계산하지 않아도 대략적인 어림을 통해 두 번째 조건 또한 만족함을 알 수 있습니다 대략적인 어림을 통해 두 번째 조건 또한 만족함을 알 수 있습니다 모비율이 1에 가까운 꽤 큰 값임에도 불구하고 모비율이 1에 가까운 꽤 큰 값임에도 불구하고 취하는 표본의 크기가 크기 때문에 표본분포는 정규분포 형태를 따를 것입니다 취하는 표본의 크기가 크기 때문에 표본분포는 정규분포 형태를 따를 것입니다 이를 직관적으로 이해하기 위해 그래프를 그려봅시다 여기 이 점을 0%로 하고 이쯤이 50% 여기는 100%가 되겠습니다 표본비율 표본분포의 평균값은 0.88이므로 대략 이쯤이 되겠죠 표본비율 표본분포의 평균값은 0.88이므로 대략 이쯤이 되겠죠 만약 취하는 표본의 크기가 작으면 표준편차가 커질 것이므로 표본분포는 왼쪽으로 왜곡된 형태가 될 것입니다 표본분포는 왼쪽으로 왜곡된 형태가 될 것입니다 하지만 이전에 보았듯이 표본 크기가 커지면 표본분포에 대한 표준편차가 작아지므로 하지만 이전에 보았듯이 표본 크기가 커지면 표본분포에 대한 표준편차가 작아지므로 하지만 이전에 보았듯이 표본 크기가 커지면 표본분포에 대한 표준편차가 작아지므로 표준편차 구간이 이렇게 좁아질테고 표준편차 구간이 이렇게 좁아질테고 정규분포 형태에 더 가까워집니다 정규분포 형태에 더 가까워집니다 따라서 경험법칙에 의해 이 분포는 대략 정규분포 형태가 된다고 말할 수 있습니다 따라서 경험법칙에 의해 이 분포는 대략 정규분포 형태가 된다고 말할 수 있습니다 하지만 이 분포가 완벽한 정규분포일까요? 아닙니다 사실 이 법칙을 바탕으로 정규분포와 왜곡을 구분하지 않는다면 사실 이 법칙을 바탕으로 정규분포와 왜곡을 구분하지 않는다면 이 그래프를 두고 여전히 왼쪽으로 긴 꼬리를 가지고 있다고 말할 수도 있습니다 즉 왼쪽으로 왜곡되었다는 말이죠 하지만 통계에서 자주 쓰이는 이 경험법칙을 통해 하지만 통계에서 자주 쓰이는 이 경험법칙을 통해 대략 정규분포를 따른다고 말할 수 있는 것입니다