If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:4:34

동영상 대본

여기 지금 보이는 것은 칸아카데미 사용자 중 한 명인 샬롯 오엔이 만든 코드입니다 칸아카데미 사용자 중 한 명인 샬롯 오엔이 만든 코드입니다 이 코드를 통해 풍선껌 자판기에서 얻어지는 표본분포를 시뮬레이션 할 수 있습니다 이 코드를 통해 풍선껌 자판기에서 얻어지는 표본분포를 시뮬레이션 할 수 있습니다 표본비율의 표본분포를 어림할 수 있죠 표본비율의 표본분포를 어림할 수 있죠 샬롯이 만든 시뮬레이션은 초록색 풍선껌의 비율을 이용하는데 전 동영상에서는 이전에 60%의 노란색 풍선껌에 대한 문제를 풀었습니다 이 시뮬레이션에 맞춰 이제 60%의 초록색 풍선껌을 가정합시다 이제 이전에 했던대로 표본 크기는 10으로 지정하고 이제 이전에 했던대로 표본 크기는 10으로 지정하고 먼저 1개의 표본부터 시작해 봅시다 이제 10개의 풍선껌을 뽑아서 이 표본에서 초록색 풍선껌의 비율을 구할 것입니다 이 표본에서 초록색 풍선껌의 비율을 구할 것입니다 첫 10개의 표본에서 5개의 초록색 껌을 뽑았습니다 그러면 여기 50% 지점에 점이 찍힐 것입니다 그러면 여기 50% 지점에 점이 찍힐 것입니다 50%의 초록색 풍선껌을 가지는 표본 1개를 뽑았습니다 이제 다른 표본을 뽑아 봅시다 이번에는 70%가 초록색입니다 계속 반복해 보겠습니다 다른 표본을 뽑으면 이번에는 50%가 초록색이네요 여기에서 뽑은 표본들의 분포를 확인할 수 있습니다 두 개의 표본에서 50%가 초록색이었죠 표본을 계속 뽑으면 그래프 상에 점이 증가합니다 표본을 계속 뽑으면 그래프 상에 점이 증가합니다 이제 10개의 풍선껌 표본을 50개 뽑아 보겠습니다 그러면 조금 더 빨리 더 많은 수의 표본분포를 볼 수 있겠죠 그러면 조금 더 빨리 더 많은 수의 표본분포를 볼 수 있겠죠 이제 1000개가 넘는 표본을 가지고 있습니다 여기서 재밌는 것은 이제 실험적으로 여기서 재밌는 것은 이제 실험적으로 표본이 갖는 표본비율의 평균값이 0.62임을 확인할 수 있다는 것입니다 표본이 갖는 표본비율의 평균값이 0.62임을 확인할 수 있다는 것입니다 몇 분 전에 이 평균값이 0.62이어야 한다고 계산했죠 몇 분 전에 이 평균값이 0.62이어야 한다고 계산했죠 뿐만 아니라 표준편차 또한 여기서 0.16으로 확인할 수 있는데 뿐만 아니라 표준편차 또한 여기서 0.16으로 확인할 수 있는데 계산한 값은 대략 0.15였습니다 계산한 값은 대략 0.15였습니다 더 많은 표본을 채취하면 채취할수록 계산한 값에 가까워집니다 더 많은 표본을 채취하면 채취할수록 계산한 값에 가까워집니다 점점 계산값에 가까워져서 이제는 어림값이 같아졌습니다 점점 계산값에 가까워져서 이제는 어림값이 같아졌습니다 점점 계산값에 가까워져서 이제는 어림값이 같아졌습니다 점점 계산값에 가까워져서 이제는 어림값이 같아졌습니다 또 하나 여기서 짚고 넘어갈 것은 모수가 0이나 1에 너무 가깝지 않으면 모수가 0이나 1에 너무 가깝지 않으면 이 분포는 대략 정규분포 모양을 따른다는 것입니다 이미 공부한 표본비율의 표본분포와 이항확률변수의 관계를 생각하면 이미 공부한 표본비율의 표본분포와 이항확률변수의 관계를 생각하면 이미 공부한 표본비율의 표본분포와 이항확률변수의 관계를 생각하면 쉽게 이해가 가능합니다 하지만 만약 모수의 값이 0에 가까운 값이면 어떻게 될까요? 예를 들어 모수가 10%라고 합시다 즉 0.1 입니다 분포의 모양이 어떻게 될까요? 이미 표본분포의 평균값이 10%라는 것을 알고 있습니다 따라서 분포 모양이 오른쪽으로 왜곡될 것이라는 것을 예측할 수 있을 겁니다 따라서 분포 모양이 오른쪽으로 왜곡될 것이라는 것을 예측할 수 있을 겁니다 이제 실제로 그렇게 되는지 확인해 봅시다 여기 얻어진 표본분포를 보면 실제로 오른쪽으로 왜곡되어 있습니다 여기 얻어진 표본분포를 보면 실제로 오른쪽으로 왜곡되어 있습니다 이 또한 쉽게 이해가 가능한데 얻을 수 있는 값은 0부터 1 사이이고 평균값이 0에 가깝다면 표본값도 대부분 0에 가까운 값일 것이므로 평균값이 0에 가깝다면 표본값도 대부분 0에 가까운 값일 것이므로 오른쪽으로 긴 꼬리를 보일 것입니다 즉 오른쪽으로 왜곡된 그래프이죠 만약 모수가 1에 가깝다면 그래프 모양이 반대가 될 것입니다 즉 왼쪽으로 왜곡된 그래프가 그려질 것입니다 실제로 이 시뮬레이션에서 왼쪽으로 왜곡된 그래프를 확인할 수 있습니다 또 하나 확인할 수 있는 흥미로운 점은 표본의 크기가 커질수록 표준편차가 작아진다는 것입니다 먼저 모수를 정확히 중앙값으로 설정하면 먼저 모수를 정확히 중앙값으로 설정하면 대략 정규분포에 가까운 그래프 모양을 확인할 수 있습니다 대략 정규분포에 가까운 그래프 모양을 확인할 수 있습니다 이제 표본 크기를 10에서 50으로 늘리면 어떻게 될까요? 이제 표본 크기를 10에서 50으로 늘리면 어떻게 될까요? 표본분포의 폭이 더 좁아진 것을 확인할 수 있습니다 물론 한 개의 점으로 수렴하는 것은 아니지만 전에 비해 훨씬 좁은 모양을 보입니다 물론 한 개의 점으로 수렴하는 것은 아니지만 전에 비해 훨씬 좁은 모양을 보입니다 이는 표본비율의 표준편차는 이는 표본비율의 표준편차는 표본 크기 n의 제곱근 값에 반비례한다는 사실로 설명이 가능합니다 표본 크기 n의 제곱근 값에 반비례한다는 사실로 설명이 가능합니다 이 시뮬레이션을 통해 표본비율의 표본분포에 대한 이 시뮬레이션을 통해 표본비율의 표본분포에 대한 좋은 직관적 이해를 얻어갈 수 있길 바랍니다 그리고 그 평균과 표준편차를 구하는 방법도요 시뮬레이션을 통해 직접 확인을 했으니 더 이해하기 편할 겁니다 시뮬레이션을 통해 직접 확인을 했으니 더 이해하기 편할 겁니다