If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

큰 수의 법칙

큰 수의 법칙 뒤에 가려진 마법에 대해 알아봅시다. 만든 이: 살만 칸 선생님

동영상 대본

큰 수의 법칙에 대해 공부해 봅시다 여러 면에서 수학과 확률론에서 가장 직관적인 법칙들 중 하나죠 하지만 너무 많은 것들에 적용될 수 있어서 종종 잘못 사용되거나 가끔 잘못 이해됩니다 그러니 제대로 접근해 볼 필요가 있습니다 먼저 이것을 정의해 보고 직관에 대해 이야기해 보겠습니다 확률변수 X를 두고 그것의 기댓값 또는 모평균을 안다고 합시다 큰 수의 법칙에 따르면 확률변수를 n회 측정해서 표본을 추출하고 모든 측정결과의 평균을 내면 다른 변수를 정의합시다 위에 줄이 있는 X_n입니다 확률변수를 n번 측정해서 얻은 평균값을 나타냅니다 이것은 첫 번째 측정 결과입니다 한 번 실험을 해서 x1을 얻고 다시 한 번 해서 x2를 얻고 n번 반복한 후 측정 횟수로 나눠줍니다 이것은 표본 평균입니다 모든 측정값의 평균이죠 큰 수의 법칙에 따르면 표본평균은 확률변수의 기댓값에 접근할 것입니다 또는 n이 무한대에 가까워지면 표본평균이 모평균에 가까워 진다고 할 수도 있죠 접근한다는 것, 수렴한다는 것이 무엇인지 정확히 증명하진 않겠지만 접근한다는 것, 수렴한다는 것이 무엇인지 정확히 증명하진 않겠지만 어쨌든 직관적으로 충분히 많은 표본을 취했을 때 결국 전체의 기댓값에 다다를 것임을 알 수 있을 것입니다 직관적으로 생각해보면 그렇습니다 충분히 많이 시행을 해서 충분한 표본을 얻으면 그 결과로는 예상했던 값과 확률이 나올 겁니다 그런데 그 결과가 왜 나타나는지를 잘못 이해하는 경우가 종종 있습니다 자세히 이야기하기 전에 한 가지 예제를 보여드리죠 큰 수의 법칙에 따르면 동전을 100번 던졌을 때 앞면이 나온 횟수를 나타내는 확률변수 X가 있다고 합시다 큰 수의 법칙은 무엇이나면 그 전에 일단 이 확률변수의 기댓값은 알고 있습니다 그 전에 일단 이 확률변수의 기댓값은 알고 있습니다 동전을 던진 횟수 즉 시행 횟수 100번에 각 시행마다 성공할 확률을 곱합니다 결과는 50이죠 큰 수의 법칙에 따르면 여러 시행의 표본을 평균내면 첫 번째 시행으로 100개의 동전을 던지거나 구두 상자에 동전 100개를 넣고 흔들고 앞면의 갯수를 세서 55가 나왔다고 합시다 이것을 x₁이라고 둡시다 다시 상자를 흔들어서 이번에는 65가 나왔다고 합시다 한 번 더 해서 이번에는 45가 나옵니다 이 작업을 n회 반복한 후 작업을 한 횟수로 나눠줍니다 큰 수의 법칙에 따르면 모든 관측 결과의 평균이 n이 무한대로 갈수록 50에 수렴한다고 말합니다 n이 50으로 수렴할때요 죄송해요 n이 무한대로 수렴할 때입니다 왜 그런지 이야기해 봅시다 직관적으로 왜 그런지를요 많은 사람들이 이렇게 생각하곤 합니다 만약 100번의 시행 후 평균보다 높다면 확률의 법칙 때문에 앞면이 더 많이 나오거나 앞면이 더 적게 나와서 차이가 상쇄될 것이라고 말입니다 꼭 그런것은 아닙니다 이것을 보통 도박사의 오류라고 말하죠 차이를 알아봅시다 예를 하나 들어 보죠 그래프를 하나 그릴게요 색을 바꾸겠습니다 색을 바꾸겠습니다 x축은 n을 나타내고 이는 시행 횟수를 뜻합니다 y축은 표본평균이라 합시다 이 확률변수의 기댓값은 50입니다 기댓값이 50이라는 것을 알고 있죠 여기에 그릴게요 여기에 그릴게요 여기가 50입니다 여기가 50입니다 제가 아까 들었던 예시로 돌아가서 n은 무엇과 같냐면 여기로 와서요 첫 번재 시행에서는 55였고 그것이 평균이었죠 측정점이 하나 뿐이니까요 두 번째 시행에서는 65가 나왔고 평균은 65에 55를 더해서 2로 나눈 값이니까 60입니다 평균이 약간 올라갔습니다 그 다음 45가 나와서 평균이 약간 내려갔습니다 45는 나타내지 않겠습니다 이제는 평균을 구해야 합니다 45에 65를 더하고 그냥 계산하도록 할게요 그냥 계산하도록 할게요 55에 65를 더하면 120 거기에 다시 45를 더하면 165죠 3으로 나눠주면 3이 165에 먼저 5번 들어가고 5 곱하기 3은 15니까 답은 53입니다 아니네요 평균은 55입니다 평균이 다시 55가 되었네요 이렇게 계속 하면 되는데 큰 수의 법칙을 이렇게 생각할 수도 있습니다 3번의 시행 후에 평균이 55가 나왔으니까 많은 사람들은 확률의 신이 나중에 동전을 던질 때 앞면이 더 적게 나오게 할 것이라고 생각합니다 다음 몇 번의 시행결과가 낮게 나와 평균을 낮출 것이라고 생각합니다 하지만 반드시 그런 것은 아닙니다 앞으로 진행해도 확률은 같습니다 앞면이 나올 확률은 항상 50%죠 시작할 때 앞면이 많이 나오거나 예상보다 앞면이 많이 나온다고 해서 뒷면이 더 많이 나오는 것은 아닙니다 이것을 도박사의 오류라고 하죠 연속으로 앞면이 나오거나 균형이 맞지 않게 앞면이 많이 나오면 언젠가 확률상 뒷면이 더 많이 나올 것이라고 생각할 수도 있습니다 하지만 그건 잘못된 생각입니다 큰 수의 법칙은 그런 것들과 상관 없습니다 유한한 횟수의 시행 후에 평균이 높게 나왔다고 가정합시다 이런 일이 일어날 확률은 낮지만요 평균이 70이라고 합시다 기댓값으로부터 상당히 많이 떨어졌다는 생각이 들 것입니다 하지만 큰 수의 법칙은 시행을 몇 번 했는지 신경쓰지 않습니다 하지만 큰 수의 법칙은 시행을 몇 번 했는지 신경쓰지 않습니다 아직 무한한 시행이 남아있기 때문입니다 그리고 무한 번 시행의 기댓값은 이런 경우에 특히 이렇게 될 것입니다 그리고 무한 번 시행의 기댓값은 이런 경우에 특히 이렇게 될 것입니다 유한한 시행의 평균을 구했을 때 어떤 높은 수가 나왔어도 무한 번의 시행을 하면 언젠가 기댓값에 수렴하게 됩니다 무한 번의 시행을 하면 언젠가 기댓값에 수렴하게 됩니다 무한 번의 시행을 하면 언젠가 기댓값에 수렴하게 됩니다 굉장히 대강 설명하는 것이긴 한데 이것이 큰 수의 법칙이 의미하는 바입니다 그리고 중요한 것은 앞면이 많이 나온다고 해서 그것을 상쇄시키기 위해 뒷면이 나올 확률이 증가한다는 것이 아닙니다 큰 수의 법칙이 의미하는 것은 유한 번의 실행에서 어떤 일이 있던 유한 번 실행의 평균이 무엇이든 무한 번의 시행이 남아있다는 겁니다 그리고 충분히 많은 시행을 하면 기댓값에 수렴한다는 것입니다 이것에 대해 잘 생각해 보아야 합니다 이것이 복권이나 카지노 등 일상생활에 실제로 사용되고 있지는 않은데 그 이유는 만약 충분히 많은 표본을 시행한다면 아주 많은 표본을 가지고 있을 때 편차가 크게 날 확률을 계산할 수도 있는데 편차가 크게 날 확률을 계산할 수도 있는데 카지노와 복권에서 이 원리가 적용됩니다 만약 충분히 많은 사람들이 개입된다면 물론 짧은 기간 동안 작은 표본을 가졌을 때 몇몇 사람들이 하우스를 이길 수도 있지만 길게 보면 하우스는 항상 이깁니다 게임의 변수들이 그렇게 되도록 하기 때문이죠 어쨌든 이것은 확률에서 중요한 개념이고 저는 꽤 직관적인 것이라고 생각합니다 비록 이렇게 공식을 사용해 확률변수로 설명되어 있는 것을 보면 약간 헷갈리기는 하지만요 결국 큰 수의 법칙이 의미하는 것은 더 많은 표본을 취할수록 그 표본의 평균이 실제 평균에 가까워진다는 것입니다 조금 더 구체적으로 말하자면 구한 표본의 평균이 모평균 또는 확률변수의 기댓값에 수렴한다는 것입니다 모평균 또는 확률변수의 기댓값에 수렴한다는 것입니다 다음 동영상에서 만나요