주요 내용
현재 시간:0:00전체 재생 길이:6:59

베르누이 분포의 평균과 분산 공식

동영상 대본

지난 동영상에서는 특정 수에 대한 베르누이 분포의 평균, 분산, 표준편차를 계산해 보았습니다 평균, 분산, 표준편차를 계산해 보았습니다 이번 동영상에서는 이를 일반화 해보려고 합니다 특정 수가 없는 상황에서 베르누이 분포의 평균과 분산을 수식으로 알아내기 위해서죠 평균과 분산을 수식으로 알아내기 위해서죠 성공할 확률이 p이고 실패할 확률이 1-p이라고만 알 때요 그렇다면 이런 모집단을 생각해 봅시다 이 분포에서 성공한 경우를 1로 정의하고 그 확률을 p로 놓습니다 그리고 실패할 확률은 1 - p로 놓습니다 이것이 무엇이든 간에 말이죠 그리고 분명히 이 둘의 백분율을 더하면 100%가 되고 그리고 분명히 이 둘의 백분율을 더하면 100%가 되고 혹은 이 두 값을 더한다면 이는 1이 될 것입니다 꼭 그래야만 합니다 이 두 개가 일어날 수 있는 유일한 경우이기 때문입니다 만약 성공할 확률이 60%라면 실패할 확률은 40%이어야 합니다 성공할 확률이 70%라면 실패할 확률은 30%여야 하고요 이 정의를 가지고 이건 베르누이 분포의 가장 일반적인 정의인데 이건 베르누이 분포의 가장 일반적인 정의인데 지난 동영상에서 했던 것과 같습니다 이제 기댓값을 계산하려 합니다 그건 이 분포의 평균과 같습니다 또한 분산도 계산해 보겠습니다 분산은 평균과 값간 제곱 거리의 기댓값과 같습니다 그렇다면 이제 해 봅시다 그럼 이것의 평균은 무엇일까요? 그럼 이것의 평균은 무엇일까요? 그건 이것이 취할 수 있는 값 가중치의 합입니다 그건 이것이 취할 수 있는 값 가중치의 합입니다 1 - p의 확률로 0, 실패를 얻습니다 그래서 (1 - p)의 확률로 0을 얻으니까 0을 곱합니다 그리고 p의 확률로 1을 얻으니까 p × 1을 더합니다 계산하기 쉽네요 어느 것에 0을 곱하던 이는 0이 됩니다 둘은 소거되고 p에 1을 곱하면 p입니다 p에 1을 곱하면 p입니다 간단하네요 이 분포에서 평균 곧 기댓값은 p입니다 p는 여기쯤 있을겁니다 다시 한번 말하자면 이 값은 흥미롭게도 이 분포에서는 취할 수 없는 값입니다 그러나 기댓값은 그렇게 됩니다 그렇다면 분산은 무엇이 될까요? 그렇다면 분산은 무엇이 될까요? 분산이 평균과 값의 제곱 거리 가중치의 합이라는 것을 기억하세요 분산이 평균과 값의 제곱 거리 가중치의 합이라는 것을 기억하세요 그럼 0을 얻을 확률은 얼마일까요? 그건 이미 구했습니다 0을 얻은 확률은 1 - p입니다 이것이 확률 부분이고 0과 평균 간 제곱 거리는 얼마일까요? 0과 평균 간 제곱 거리는 얼마일까요? 써보자면 취하는 값인 0에서 아까처럼 파란색으로 쓸게요 이 평균을 빼고 다른 색깔로 할게요 저 오렌지 색과 너무 비슷하네요 평균은 흰색으로 쓰겠습니다 0에서 평균인 p를 빼고 1을 얻을 확률 p에 이건 제곱 거리입니다 조심해야겠네요 이것은 평균에서의 확률 가중치의 합이죠 이것은 평균에서의 확률 가중치의 합이죠 그렇다면 1과 평균사이의 거리는 얼마일까요? 그렇다면 1과 평균사이의 거리는 얼마일까요? 이는 1에서 평균 p를 빼고 제곱한 값입니다 이는 1에서 평균 p를 빼고 제곱한 값입니다 이것이 분산입니다 정리하면 다음과 같습니다 1 - p에 0 - p는 -p이고 제곱하면 p²입니다 제곱하면 p²입니다 그리고 더해야 하는데 p와 곱해줄 (1 - p)²은 얼마일까요? (1 - p)²은 1²인 1이고 이 둘의 곱에 2를 곱한 후 빼 줍니다 -2p가 되겠죠 그리고 (-p)²를 더해 줍니다 p²이죠 그리고 이제 이것들을 전개해 봅시다 이 항은 p² - p³이고 그리고 이 항은 p × 1은 p가 되고요 p × -2p는 -2p²이고 p × p²은 p³이 됩니다 그리고 간단히 하면 -p³은 +p³과 소거되고 p² - 2p²은 잠시후에 계산하도록 하고요 여기 있는 p는 그냥 p이고 그리고 다시 돌아와 p²에 -2p²을 더하면 -p²만이 남게 됩니다 p를 밖으로 빼고 싶다면 이는 p/p는 1이고 p²/p는 p이니까 p(1 - p)와 같습니다 깔끔한 공식입니다 그래서 분산은 p(1 - p)가 됩니다 다음 단계로 넘어가서 표준편차에 대해 알고 싶다면 다음 단계로 넘어가서 표준편차에 대해 알고 싶다면 표준편차는 분산의 제곱근이니까 √(p(1 - p))와 같습니다 이 공식들이 예제에서도 잘 적용되는지 봅시다 이 공식들이 예제에서도 잘 적용되는지 봅시다 평균은 성공할 확률인 p였습니다 이 경우에는 역시 0.6이 맞고 또한 분산은 성공 확률에 실패 확률을 곱한 것이나 마찬가지입니다 또한 분산은 성공 확률에 실패 확률을 곱한 것이나 마찬가지입니다 이걸 보면 그렇죠 예제에 있는 성공확률은 0.6이고 실패할 확률은 0.4입니다 이 둘을 곱하게 되면 0.24라는 값이 나오게 되는데 이 예시에서 구했던 값과 일치합니다 그리고 여기처럼 제곱근을 취해서 표준편차를 계산하면 0.49입니다 많은 도움이 되셨으리라 생각됩니다 다음번에는 이를 바탕으로 추론통계학에 대해 설명드리겠습니다