If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

모비율 비교하기 1

선거 예제를 통해 모비율을 비교해 봅시다. 만든 이: 살만 칸 선생님

동영상 대본

다가올 선거에서 어떤 후보에게 투표할 남성의 비율과 여성의 비율에 의미있는 차이가 있는지 알아보고 싶다고 합시다 의미있는 차이가 있는지 알아보고 싶다고 합시다 모집단분포를 살펴보죠 남성 중에 어떤 비율은 이 후보에게 투표합니다 남성 중에 어떤 비율은 이 후보에게 투표합니다 P₁이라고 합니다 이것은 후보에게 투표하는 비율이고요 남성의 나머지는 후보에게 투표하지 않습니다 1 - P₁은 후보에게 투표하지 않는 것이죠 여성의 경우에도 비슷합니다 여성의 경우에도 비슷합니다 여성의 경우에도 이떤 비율은 후보에게 투표하는데 투표하는 남성의 비율인 P₁과 같은지 모르니까 P₂라고 하겠습니다 그리고 나머지 여성들은 후보에게 투표하지 않습니다 1 - P₂이죠 그리고 투표하지 않는 것은 0 하는 것은 1입니다 이것 둘 다 베르누이 분포이고 나중에 유용할텐데 이 분포의 평균은 투표하는 사람의 비율과 같습니다 이 분포의 평균은 투표하는 사람의 비율과 같습니다 따라서 남성의 평균 혹은 투표할 남성의 비율을 μ₁ = P₁이라고 하겠습니다 μ₁ = P₁이라고 하겠습니다 노란색으로 바꿀게요 노란색으로 바꿀게요 이 분포의 평균은 P₁이고요 이 분포의 분산 σ²₁은 이 두 비율의 곱입니다 이 두 비율의 곱입니다 P₁(1-P₁)이죠 훨씬 전 동영상에서 베르누이 분포를 배울 때 알아보았습니다 훨씬 전 동영상에서 베르누이 분포를 배울 때 알아보았습니다 여성의 경우도 똑같습니다 여성의 경우도 똑같습니다 이 베르누이 분포의 평균은 p₂이고 이 베르누이 분포의 평균은 P₂이고 분산은 이 두 비율의 곱입니다 분산은 이 두 비율의 곱입니다 P₂(1-P₂)이죠 이제 해야 할 것은 처음에 말했지만 남성과 여성의 투표에 의미있는 차이가 있는지 알아보는 것입니다 의미있는 차이가 있는지 알아보는 것입니다 써 볼게요 이것이 의미가 있을까요? 차이에 의미가 있을까요? 이 동영상에서는 이 모수에 대한 95%의 신뢰구간을 구해 볼 것입니다 이 동영상에서는 이 모수에 대한 95%의 신뢰구간을 구해 볼 것입니다 모수의 차도 모수입니다 모집단에서 모수의 실제 차는 알지 못하지만 모집단에서 모수의 실제 차는 알지 못하지만 이 두 모집단 비율의 차이기도 하죠 그 차의 95% 신뢰구간을 찾아보겠습니다 그 차의 95% 신뢰구간을 찾아보겠습니다 이를 위해 투표를 할만한 남성 1000명과 이를 위해 투표를 할만한 남성 1000명과 투표를 할만한 여성 1000명을 구했습니다 써 볼게요 남성이 1000명이고 1000명을 설문 조사 했을 때 642명이 특정 후보에게 투표하겠다고 했습니다 이것이 1이고요 나머지 358명은 그냥 나머지라 적고 0을 나타냅니다 여성의 경우도 똑같이 합니다 투표를 할만한 여성 1000명을 구하고 임의추출 했다고 하고요 591명이 특정 후보에게 투표하기로 했습니다 591명이 특정 후보에게 투표하기로 했습니다 나머지는 그 후보에게 투표하지 않겠다고 했습니다 나머지는 그 후보에게 투표하지 않겠다고 했습니다 여기서 표본비율, 혹은 표본평균만 놓고 보았을 때는 차이가 있는 것 같네요 하지만 그래도 신뢰구간을 구해야 합니다 방금 한 것을 다시 짚어보도록 할게요 여기서 남성의 표본비율을 구할 수 있습니다 여기서 남성의 표본비율을 구할 수 있습니다 여기서 남성의 표본비율을 구할 수 있습니다 그것은 결국 이 표본의 표본평균과 같습니다 그것은 결국 이 표본의 표본평균과 같습니다 1이 642개고 나머지는 0이니까 분자는 642이고 표본이 1000개니까 642/1000는 0.642네요 따라서 이것은 표본평균과 표본비율 모두로 볼 수 있습니다 따라서 이것은 표본평균과 표본비율 모두로 볼 수 있습니다 여성의 경우에도 똑같이 해보면 표본비율은 0.591입니다 아니면 여성 1000명의 표본의 표본평균으로 볼 수도 있죠 아니면 여성 1000명의 표본의 표본평균으로 볼 수도 있죠 후보에게 투표하는 사람은 1 아닌 사람은 0입니다 정확히 시각화하기 위해 표본비율의 표본분포를 그려 볼게요 표본비율의 표본분포를 그려 볼게요 큰 표본 크기를 가지고 있습니다 큰 표본 크기를 가지고 있습니다 비율이 0이나 1에 가깝지 않고 표본 크기가 커서 비율이 0이나 1에 가깝지 않고 표본 크기가 커서 표본분포는 거의 정규분포의 형태를 띕니다 표본분포는 거의 정규분포의 형태를 띕니다 표본분포는 거의 정규분포의 형태를 띕니다 이렇게 써 보죠 표본비율의 표본분포라고요 여기쯤에 평균이 있겠네요 표본비율 표본분포의 평균입니다 표본비율 표본분포의 평균입니다 이건 많이 보았습니다 이건 모평균과 같고 이건 모평균과 같고 모평균은 실제 모집단의 비율입니다 모평균은 실제 모집단의 비율입니다 P₁과 같습니다 이것은 알지 못하는 것이고요 그리고 이것의 분산은 이 또한 여러 번 보았는데 이 분포의 분산은 그전에 이건 남성이니까 1을 붙이고요 이 분포의 분산은 중심극한정리에 의해 여기 위의 분포의 분산과 같고 이는 P₁(1-P₁)을 표본 크기인 1000으로 나눈 것과 같습니다 이는 P₁(1-P₁)을 표본 크기인 1000으로 나눈 것과 같습니다 여성의 경우도 똑같이 하면 됩니다 여성의 경우도 똑같이 하면 됩니다 표본분포를 그리고요 표본분포를 그리고요 여성 표본평균의 표본분포입니다 이쪽은 남성이니까 1을 붙일게요 이쪽은 남성이니까 1을 붙일게요 그리고 이쪽은 여성 쪽입니다 2를 붙이도록 하죠 이 분포에도 어떤 평균이 있을 것입니다 이 분포에도 어떤 평균이 있을 것입니다 이쯤에 그려 볼게요 평균은 이렇게 표기합니다 여성 표본비율 표본분포의 평균은 모평균과 같고 그것은 이미 P₂와 같다고 알고 있습니다 그것은 이미 P₂와 같다고 알고 있습니다 그리고 표본분포의 분산은 여기 이 분산을 표본 크기로 나눈 값입니다 여기 이 분산을 표본 크기로 나눈 값입니다 P₂(1 - P₂) / n이죠 P₂(1 - P₂) / n이죠 최종 목표는 위에 이것의 95% 신뢰구간을 찾는 것이었습니다 최종 목표는 위에 이것의 95% 신뢰구간을 찾는 것이었습니다 그렇기 때문에 이 표본분포도 아니고 이 표본분포도 아닌 양쪽 표본분포의 차의 표본분포에 대해 생각해 볼 겁니다 양쪽 표본분포의 차의 표본분포에 대해 생각해 볼 겁니다 양쪽 표본분포의 차의 표본분포에 대해 생각해 볼 겁니다 이미 해 본겁니다 지금은 비율에 대해 이야기하고 있지만 일반적으로 표본평균을 비교할 때와 같은 개념입니다 일반적으로 표본평균을 비교할 때와 같은 개념입니다 그럼 해 볼게요 그럼 해 볼게요 분포를 봅시다 그 전에 이 표본평균, 표본비율은 그냥 표집해서 구했습니다 그것은 이 표본분포에서 표집한 것이라 볼 수 있죠 그것은 이 표본분포에서 표집한 것이라 볼 수 있죠 오른쪽의 표본비율을 구했을 때는 여기서 표집하는 것이라고 볼 수 있습니다 여기서 평균을 구할 때 표본을 1000개 구했고 이는 표본분포에서 표본을 구하는 것과 같습니다 이는 표본분포에서 표본을 구하는 것과 같습니다 이제 이 분포는 모든 표본비율 차의 분포가 될 것입니다 모든 표본비율 차의 분포가 될 것입니다 이런 모양이고 어떤 평균을 같습니다 다른 색으로 할게요 초록색으로 하죠 노랑과 파랑은 초록색이니까요 노랑과 파랑은 초록색이니까요 이 표본분포는 P₁ - P₂ 통계량의 분포입니다 이 표본분포는 P₁ - P₂ 통계량의 분포입니다 여기가 평균이고 여기가 평균이고 P₁의 표본비율 - P₂의 표본비율 평균입니다 P₁의 표본비율 - P₂의 표본비율 평균입니다 이전 동영상들에서 배운 것처럼 이는 정확히 위 두 개의 평균의 차와 같습니다 이는 정확히 위 두 개의 평균의 차와 같습니다 그리고 그것은 P₁ - P₂와 같죠 그래서 이것은 P₁ - P₂입니다 그래서 이것은 P₁ - P₂입니다 그리고 이 분포의 분산은 위의 두 분포 분산의 합입니다 위의 두 분포 분산의 합입니다 그래서 이것과 이 분산의 합이고요 표준편차가 아니기 때문에 제곱근은 사용하지 않습니다 표준편차가 아니기 때문에 제곱근은 사용하지 않습니다 지금은 분산만 계산할게요 이것도 붙여 줍니다 이것도 붙여 줍니다 이것도 붙여 줍니다 그래서 분산은 이렇게 됩니다 그래서 분산은 이렇게 됩니다 표준편차를 구하려면 이것을 지우면 됩니다 양쪽의 제곱근을 구하면 되죠 표준편차는 분산의 제곱근이니까요 그래서 제곱을 없애는 것입니다 그래서 제곱을 없애는 것입니다 그리고 오른쪽도 제곱근을 씌워 줍니다 그리고 오른쪽도 제곱근을 씌워 줍니다 여태까지는 이해를 돕기 위한 것들이었고 여태까지는 이해를 돕기 위한 것들이었고 이제 신뢰구간을 구해 보겠습니다 이제 신뢰구간을 구해 보겠습니다 P₁ - P₂의 95% 신뢰구간 P₁ - P₂의 95% 신뢰구간 혹은 이 평균의 95% 신뢰구간을 구해야 합니다 동영상이 너무 길어지기 전에 신뢰구간을 구하는 것은 다음 동영상에서 해 보겠습니다 신뢰구간을 구하는 것은 다음 동영상에서 해 보겠습니다