주요 내용
유의수준과 오차범위를 기반으로 표본 크기 구하기
유의수준과 오차범위를 기반으로 표본 크기를 구해 봅시다.
동영상 대본
델라는 한 표본 z구간을 만들어서 지역 주민들이 학교 기금을 위하여 세금이 인상에 찬성하는 비율을 추정하고자 합니다 오차범위는 ±2% 이내이고 오차범위는 ±2% 이내이고 신뢰수준은 95% 입니다 이상적인 오차범위를
만족하기 위해서 필요한 최소한의 표본의
크기는 얼마일까요? 신뢰구간이 어떻게 생겼는지 거기서 오차범위는 어디 있는지 다시 떠올려 봅시다 그러면 그녀가 원하는 표본의 크기를 얻을 수 있습니다 세금 인상에 찬성하는 모비율을 추정하고자 합니다 아직 그 값은 모릅니다 표본의 크기를 n이라 하고 이 문제는 이상적인 오차범위를
만족하기 위한 n을 구하는 것입니다 표본의 크기와 상관없이 표본비율을 계산합니다 설계하려는 신뢰구간은 이 표본비율의 ±임계값입니다 이 임계값은 신뢰수준이
바탕이 됩니다 잠시 후에 다시 말씀드리죠 95% 신뢰수준에 대응하는 임계값 z*가 있고 여기에 통계량의 표준오차를 곱합니다 이 경우에선 표본비율의 표준오차의
제곱근인데 √(p^(1-p^))/n 입니다 √(p^(1-p^))/n 입니다 오차범위가 2%를
넘으면 안되는데요 이 부분이 오차범위입니다 따라서 이 부분은 2%가 넘으면 안되고 2%보다 작거나 같아야 합니다 색깔이 좀 과한가요 씁슬하네요 2%보다 작거나 같아야 합니다 어떻게 계산할까요? 우선 95%의 신뢰수준을 포함해야 합니다 표준정규분포표를 살펴봅시다 신뢰수준은 95%이고 이는 만약 정규분포가 있다면 이는 만약 정규분포가 있다면 95%의 신뢰수준이
의미하는 것은 표준편차의 값인데 이 95%에 해당하는
부분을 포착하기 위해 이 사이에 있습니다 따라서 색칠하지 않은 부분은
2.5%입니다 따라서 색칠하지 않은 부분은
2.5%입니다 따라서 색칠하지 않은 부분은
2.5%입니다 표준정규분포표를 살펴보면 표준정규분포표를 살펴보면 95%는 보지 않습니다 2.5%가 남는 부분을
살펴보아야 합니다 색칠되지 않은 부분이죠 따라서 97.5%에
대하여 살펴봅니다 하지만 신뢰수준 95%가 일반적이므로 임계값은 1.96입니다 알아두면 좋습니다 표준정규분포표에서
나온 값입니다 따라서 이 값은
1.96입니다 z*는 1.96이 되겠죠 p^은 무엇일까요? 표본의 크기를 구하기 전까지 표본비율을 알 수 없습니다 하지만 문제는
표본을 얼마나 뽑느냐입니다 표시한 이 부분은 색칠을 다시할게요 밝은 파란색이 됐네요 이 부분이 2%보다
작거나 같아야 합니다 이것이 오차범위입니다 여기서 할 수 있는 것은 표본비율을 뽑는 것입니다 어떻게 될지는 모르겠지만 이 부분이 최대가
되어야 합니다 이 부분을 최대로 만들면 문제에서 요구하는
답을 구할 때 문제에서 요구하는
답을 구할 때 안전하게 구할 수 있습니다 p^의 최댓값 p^(1-p^)을
최대로 만들 때 시행착오를 겪을 수 있습니다 이 식은 이차식입니다 결과적으로
p^ = 0.5 입니다 아직 모르는 값이 있습니다 아직 표본의 크기를 모릅니다 임의표본을 추출하지
않았습니다 표본비율을 계산했지만 안전한 n의 값을 구해야 합니다 오차범위를 최대로 만드는 표본비율은 무엇일까요? 이를 임의로 가정하고 n을 계산해 봅시다 부등식을 만들어보죠 임계값 1.96 × √ 표본비율을
0.5라고 가정합니다 표본을 추출할 때까지 아직 그 값을 모릅니다 √0.5·0.5 √0.5·0.5 1.96√0.5·0.5/n ≤ 0.02 1.96√0.5·0.5/n ≤ 0.02 1.96√0.5·0.5/n ≤ 0.02 n을 구하기 위해서는 계산이 필요합니다 해봅시다 이렇게 쓸 수 있겠죠 양변을 1.96으로 나눕니다 1/1.96 정리하면 좌변은 √0.5·0.5/n 좌변은 √0.5·0.5/n 다시 정리하면 0.5/√n 0.5/√n ≤ 이렇게 적어볼게요 이는 2/100와 같습니다 그러므로
2/100 × 1.96이 됩니다 즉, 2/196입니다 살짝 내려봅시다 통계학을 배우면서 통계학을 배우면서 이런 계산을 종종 하죠 양변 모두 역수를 취합니다 양변 모두 역수를 취합니다 √n/0.5 196/2 196/2는 무엇일까요? 98입니다 98입니다 양변에 역수를 취하면 부등식의 방향이 바뀌죠 크거나 같은 모양이 됩니다 양변에 0.5를 곱합니다 0.5 잘못 썼네요 0.5가 맞겠죠 계산합시다 √n ≥ 49 √n ≥ 49 즉 n ≥ 49² 입니다 49²은 무엇일까요? 50²는 2500이죠 이 값에 가까울 것입니다 따라서 보기 D가
정답입니다 따라서 보기 D가
정답입니다 직접 계산하고 싶다면 49 × 49
9 × 9 = 81 9 × 4 = 36
36 + 8 = 44 4 × 9 = 36 4 × 4 = 16
16 + 3 = 19 모두 더하면 모두 더하면 10, 14 2401이 됩니다 따라서 원하는
오차범위를 위한 즉, 2%보다 작기 위한 최소한의 표본입니다 오차범위는 표본의 크기가
2401이라면 표본비율이
0.5보다 작다면 혹은 0.5보다 크다면 오차범위가 이보다
작을 것입니다 오차범위가 이보다
작을 것입니다 이보다 크지 않기를
원합니다 또다른 중요한 것은 n을 구하기 위한 계산과정이
복잡하지 않았지만 n이 2401.5라면 소수 첫째 자리에서
반올림해야 합니다 표본의 크기는 항상 정수이기 때문이죠 이상입니다