주요 내용
현재 시간:0:00전체 재생 길이:8:20

베르누이 분포의 평균과 분산에 대한 예제

동영상 대본

모집단에 있는 모든 사람을 설문조사 했다고 해 봅시다 보통 현실적인 일은 아니지만 제가 그렇게 했다고 합시다 사람들에게 대통령에 대해 어떻게 생각하는지 물어보았고 비호의적인 등급 또는 호의적인 등급에서 선택하게 했습니다 비호의적인 등급 또는 호의적인 등급에서 선택하게 했습니다 비호의적인 등급 또는 호의적인 등급에서 선택하게 했습니다 비호의적인 등급 또는 호의적인 등급에서 선택하게 했습니다 만약 모집단 전원을 설문조사 했는데 40%는 비호의적인 등급을 60%는 호의적인 등급을 주었을 때 40%는 비호의적인 등급을 60%는 호의적인 등급을 주었을 때 확률분포를 그리면 두 가지의 선택지가 있었기 때문에 이항분포가 됩니다 두 가지의 선택지가 있었기 때문에 이항분포가 됩니다 사람들은 비호의적인 시각을 가질 수도 있고 호의적인 시각을 가질 수도 있습니다 40%는 비호의적인 시각을 가졌으므로 색칠해 주고요 40%, 즉 0.4는 이렇게 될 것이고 40%라고 써 놓겠습니다 그리고 60%는 호의적인 시각을 가졌습니다 그리고 60%는 호의적인 시각을 가졌습니다 색칠해 주고요 60%가 호의적인 시각을 가졌습니다 그리고 두 수를 합치면 100이 됩니다 두 선택지 중 한 개를 꼭 골랐기 때문입니다 이제 모집단에서 임의로 한 명을 뽑아 그 구성원의 호의성를 조사한다면 호의성의 기댓값은 얼마일까요? 그 구성원의 호의성를 조사한다면 호의성의 기댓값은 얼마일까요? 이 분포의 평균이 무엇인지 생각하는 것과 같습니다 이 분포의 평균이 무엇인지 생각하는 것과 같습니다 이와 같은 이항분포의 경우 평균 또는 기대값은 분포가 취할 수 있는 여러 값 확률 가중치의 합이 될 것입니다 분포가 취할 수 있는 여러 값 확률 가중치의 합이 될 것입니다 제가 써놓은 이 방법으로는 U와 F의 확률 가중치의 합을 취할 수 없습니다 40% × U + 60% × F로는 아무 값도 얻을 수 없습니다 40% × U + 60% × F로는 아무 값도 얻을 수 없습니다 그래서 U와 F를 어떠한 값을 가지도록 정의할 것입니다 그래서 U와 F를 어떠한 값을 가지도록 정의할 것입니다 그러면 U가 0이고 F가 1이라고 가정해 봅시다 그러면 확률 가중치의 합을 취한다는 개념이 말이 됩니다 그러면 확률 가중치의 합을 취한다는 개념이 말이 됩니다 이 분포의 평균은 여기 이 확률인 0.4에 0을 곱하고 0.6 · 1을 더해 줍니다 계산해 보면 이건 0이고 0.6 x 1은 0.6입니다 이건 0이고 0.6 x 1은 0.6입니다 분명히 어떠한 사람도 0.6이란 값을 가질 순 없습니다 여기선 아무도 60 % 호의적이고 40 % 비호의적이라 할 수 없습니다 여기선 아무도 60 % 호의적이고 40 % 비호의적이라 할 수 없습니다 누구나 호의적이거나 비호의적인 것 중 꼭 선택해야 합니다 호의하는 정도가 0.6인 사람은 결코 없습니다 호의하는 정도가 0.6인 사람은 결코 없습니다 1 또는 0이어야 하죠 이건 평균, 또는 기댓값이 분포가 취할 수 있는 값이 아닌 흥미로운 경우입니다 분포가 취할 수 있는 값이 아닌 흥미로운 경우입니다 불가능한 이쯤에 있는 값이죠 불가능한 이쯤에 있는 값이죠 하지만 이것이 평균, 또는 기댓값인 것은 맞습니다 이것이 말이 되는 이유는 100명을 설문조사해서 이 수에 100을 곱하면 60명이 호의적일 것이라 기대할 수 있습니다 모두 합치면 60명은 호의적 40명은 0이라 답하겠죠 60%가 호의적일 것이라 말하고 있는데 이는 모집단분포가 나타내는 것과 동일합니다 그러면 분산은 얼마일까요? 이 모집단의 분산은 얼마일까요? 분산은 여기에 새로운 색으로 쓸게요 분산은 평균으로부터의 제곱 거리 확률 가중치의 합 분산은 평균으로부터의 제곱 거리 확률 가중치의 합 혹은 평균으로부터 제곱 거리의 기댓값이라고 할 수 있습니다 혹은 평균으로부터 제곱 거리의 기댓값이라고 할 수 있습니다 그건 얼마이나고요? 가능한 값은 두 가지가 있습니다 가능한 값은 두 가지가 있습니다 0이나 1중 하나를 취할 수 있죠 0을 얻을 확률은 0.4입니다 0을 얻을 확률은 0.4입니다 0을 얻는다면 0에서 평균까지의 거리는 얼마일까요? 0에서 평균까지의 거리는 0 - 0.6 아니면 제곱할 것이니까 0.6 - 0이라고 해도 됩니다 (0 - 0.6)²입니다 분산은 제곱 거리 가중치의 합이라는 것을 기억해야 합니다 이건 0과 평균 사이의 차이이고 0.6의 확률로 1을 얻으니까 1과 평균 0.6의 차이를 계산합니다 1과 평균 0.6의 차이를 계산합니다 그리고 제곱해서 더해 줍니다 계산하면 얼마일까요? 0.4 x 0.6²인데 0 - 0.6 = -0.6이고 제곱하면 0.36이니까 0 - 0.6 = -0.6이고 제곱하면 0.36이니까 이 값은 0.36이고 이 값은 0.36이고 여기 이 값은 0.6(1 - 0.6)²를 더해 주어야 하니까 0.6(1 - 0.6)²를 더해 주어야 하니까 1 - 0.6은 0.4이고 0.4² = 0.16입니다 0.4² = 0.16입니다 이 값은 0.16입니다 계산기로 나머지를 계산해 볼게요 계산기로 나머지를 계산해 볼게요 계산기로 나머지를 계산해 볼게요 .4 * .36 + .6 * .16은 0.24입니다 .4 * .36 + .6 * .16은 0.24입니다 따라서 이 분포의 표준편차는 0.24입니다 그게 아니라 분포의 분산이 0.24이고 분포의 표준편차는 이것의 제곱근입니다 분포의 표준편차는 이것의 제곱근입니다 이 분포의 표준편차는 √0.24이고 계산해 보면 이 분포의 표준편차는 √0.24이고 계산해 보면 √(0.24)는 0.48..인데 반올림해서 0.49라 하겠습니다 √(0.24)는 0.48..인데 반올림해서 0.49라 하겠습니다 이건 0.49와 같습니다 이 분포를 보면 분포의 평균은 0.6이고 분포의 평균은 0.6이고 표준편차는 0.5입니다 표준편차는 여기 쯤에 있는데 표준편차 하나를 더하면 거의 1.1이 되기 때문입니다 표준편차 1배 위는 여기고 표준편차 1배 아래는 여기 쯤입니다 표준편차 1배 아래는 여기 쯤입니다 말이 됩니다 취할 수 없는 값들이 있어서 이항분포를 직관적으로 이해하기가 쉽지 않지만 이 분포가 오른쪽으로 치우쳐져 있다는 건 말이 됩니다 이 분포가 오른쪽으로 치우쳐져 있다는 건 말이 됩니다 이 예제를 특정한 수를 가지고 보여드린 것은 왜 이 분포가 유용한지 보여드리고 싶었기 때문입니다 왜 이 분포가 유용한지 보여드리고 싶었기 때문입니다 다음 동영상에서는 일반적인 경우를 살펴보겠습니다 이것이 성공할 확률 p 이것은 실패할 확률 1 - p일 때이죠 이것은 실패할 확률 1 - p일 때이죠 그런 다음 이 분포의 평균, 분산 표준편차를 구하는 공식을 살펴보도록 하겠습니다 그리고 이 분포는 베르누이 분포라고 합니다 그리고 이 분포는 베르누이 분포라고 합니다 가장 간단한 경우의 이항분포이죠