If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:7:02

이론적 확률과 통계적 확률

동영상 대본

당신은 가방을 가지고 있습니다. 그리고 그 안에 몇개의 구슬을 넣어보죠. 우선 이 자홍색 구슬 50개를 넣고요. 자, 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱.. 다 그리지 않아도 대충 어떤 얘기인지 아시겠죠? 여기에 50개의 자홍색 구슬이 있습니다. 이번엔 50개의 파란색 구슬을 넣습니다. 자 이제 당신은 100개의 구슬을 가지고 있습니다. 절반은 자홍색, 절반은 파란색이죠. 구슬을 꺼내기 전에 당신의 눈을 가려 봅시다. 그리고 가방을 흔들어 구슬을 골고루 섞어 줍니다. 자, 이제 이론적으로 얘기해 보겠습니다. 당신이 눈을 가린 채 이 가방에서 자홍색 구슬을 집을 확률은 몇이 될까요? (왠지 '자홍색'이란 말을 자홍색으로 쓰고 싶네요.) 자홍색 구슬을 뽑을 확률은 몇일까요? 이론적으로, 가방 안에 100개의 구슬이 들어있기 때문에 총 100번 뽑을 수 있다는 가능성이 존재하죠. 그 중에 50번은 자홍색을 뽑을 가능성이고요. 100분의 50, 따라서 2분의 1과 같습니다. 그래서 이렇게 얘기할 수 있죠. "이론적으로 1/2의 확률이야! 방금 계산해봤거든." 동등하게 100개의 가능성이 있다고 생각했을 때, 그 중 50번은 자홍색을 집게 됩니다. 이제 직접 실험을 해볼까요? 말 그대로 자홍색 구슬과 푸른색 구슬이 각각 50개 든 가방을 준비해 봅시다. 그리고 직접 구슬을 뽑아보세요. 어떤 구슬을 뽑았는지 확인하고, 다시 집어넣고, 또 다시 새로운 구슬을 뽑고.. 구슬을 새로 뽑을 때마다 새로 관찰하는 실험이죠. 10번의 실험 결과, 당신이 자홍색 구슬을 7번, 파란색 구슬을 3번 뽑았다고 해 봅시다. 이 10번의 실험 결과에서 이상한 점을 느끼셨나요? 정확히 절반이 자홍색 구슬은 아니었죠. 7번은 자홍색, 또 3번은 파란색 구슬이었으니까요. 그러나 이것은 충분히 타당한 결과입니다. 만약 자홍색을 뽑을 확률이 정말 1/2라면, 충분히 7번을 뽑았을 수도 있습니다. 하지만 뭐, 그렇다면 손을 잘못 놀리거나 하는 행위를 했겠죠. 하지만 많은 실험을 한 것이 아닌, 고작 10번의 실험 결과였기 때문에 충분히 타당하다고 봅니다. 나중에 통계학에서 좀 더 상세히 배우겠지만, 이런 상황에서는 늘 변수가 존재합니다. 특히 이런 10번정도의 실험에서는 말이죠. 1/2의 정확한 확률은 나오지 않을 수 있습니다. 구슬을 5번 뽑는 대신 7번 뽑는 것은 충분히 일어날 수 있는 일이죠. 따라서 이게 큰 문제가 되지는 않습니다. 제가 수학적으로 계산해서 1/2 확률이 나왔는데 왜 자홍색이 7번 나왔지? 하고 질문을 하진 않겠죠. 하지만 당신이 시간이 충분해서 10,000번 정도 실험을 했다고 생각해 봅시다. 자, 아까 한 것처럼 10,000번의 실험을 했습니다. 보지 않고 가방에 손을 넣어서 구슬을 하나 꺼내고, 구슬을 관찰해서 어떤 것을 꺼냈는지 기록합니다. 자, 10,000번의 실험 결과, 7,000번 자홍색 구슬을 골랐습니다. 실제로는 약간의 차이가 있겠지만, 극단적인 숫자를 사용해 볼게요. 8,000번은 자홍색 구슬, 2,000번은 푸른색 구슬을 꺼냈습니다. 흥미롭네요. 여전히 생각치 못한 결과가 나왔어요. 10번이 아닌 엄청나게 실험을 했음에도 말이죠. 10번은 숫자에 비해 꽤 타당한 결과였습니다. 우리는 그 실험에서 각각 5번씩 뽑은 게 아니라 7번의 자홍색과 3번의 푸른색 구슬을 꺼냈었죠. 하지만 지금 총 10,000번의 실험을 했습니다. 만약 1/2라는 위의 확률이 실제로 맞다면 이번 실험결과는 충분히 예상가능했겠죠. 구슬을 각각 절반씩 뽑을 거라 예상했을 거예요. '5,000번은 자홍색, 5,000번은 푸른색' 이렇게요. 하지만 8,000번 자홍색 구슬을 뽑았어요. 이것 또한 확률의 범위안에 있다는 거죠. 만약 자홍색을 꺼낼 확률이 정말 1/2이라면, 이런 실험결과가 나왔다는 건 말이 안되죠. 이렇게 많은 실험을 했는데도 말이에요. 자, 이 실험에 의한 확률을 보세요. 총 10,000번의 실험을 했는데 이 실험에 의한 확률은, 당신은 총 10,000번의 시도, 혹은 실험에서, 8,000번 자홍색 구슬을 꺼냈습니다. 따라서 80%, 혹은 10분의 8 확률을 가지게 되죠. 자, 전의 확률과 뭔가 굉장한 차이가 보이는데요. 제가 이 문제를 심각하게 대하는 건, 10,000번이란 많은 실험을 했음에도 불구하고 만약 정말 확률이 1/2이라면, 이렇게 많은 자홍색 구슬을 뽑을 수 있었을까요? 자, 이게 어떻게 된 일인지에 관해 설명해 봅시다. 이 10번의 실험에선 별로 큰 문제라 여기지 않았죠. 하지만 이번은 무려 10,000번의 실험이었기 때문에 곤란함을 느끼게 하네요. 자, 그래서 왜 이런 일이 생겼을까요? 매번 가방을 흔들어서 구슬을 잘 섞어주기까지 했는데. 하지만 다른 가능성도 존재하죠. 푸른 구슬이 더 무거워서 흔들 때 바닥으로 내려갔다던지 하는. 아마 그래서 자홍색 구슬을 더 많이 뽑았을지도요. 또 푸른 구슬만 질이 달라서 손에서 미끄러지거나, 잡기 힘들어서 자홍색을 더 잘 뽑았을 지도 모르죠. 이렇듯이 가방 안의 일을 제가 설명하진 못하지만, 이론적으로는 1/2의 확률을 가져야 맞는거죠. 왜냐면 자홍색 구슬은 절반만큼 들어있으니까요. 하지만 실험결과를 보면, 저는 80%, 즉 총 10,000번의 실험에서 8,000번을 자홍색 구슬을 뽑았죠. 상당히 곤란하게 만드는 결과네요. 저는 이제 빨간색, 아니 자홍색과 푸른색을 뽑을 확률이 정말 반반으로 같을지 고민하기 시작했습니다. 뭔가 다른 특징이 있는 것이 분명합니다.