If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

확률변수 합과 차의 분산

두 개의 독립된 확률변수의 합과 차이가 분산의 합과 같은 이유에 대한 직관을 키워 봅시다.

동영상 대본

여기 두 개의 확률변수를 정의합시다 첫 번째 확률변수 X는 우리가 가장 좋아하는 시리얼인 Mathies의 임의의 박스안에 들어있는 시리얼의 무게입니다 임의의 박스안에 들어있는 시리얼의 무게입니다 그리고 이에 대해 몇가지 더 알고 있는 것이 있습니다 X의 기댓값이 16온스란 사실을 알고 있습니다 박스의 겉표지에 표기돼 있습니다 여기 총 중량이 16온스라고 말이죠 이제, 시리얼 박스를 봤을 때 모든 박스의 무게가 정확히 16온스라는 뜻이 아닙니다 여기 이산개수의 플레이크들이 있고 그것들은 조금씩 밀도가 다르거나 생김새가 다릅니다 그것들이 포장된 방식에 따라서 말입니다 그러니 여기에는 조금 변동이 생길 수 있고 이는 표준편차로 잴 수 있습니다 확률변수 X의 표준편차는 이 문제에서 0.8온스라고 합시다 0.8온스라고 합시다 그리고 나중에 좀 더 직관을 발휘하기 쉽게 하기 위해 확률변수 X는 언제나 특정 범위 안에 속한다고 합시다 만약 특정 무게보다 크고 특정 무게보다 작다면 시리얼 회사는 그 박스를 폐기합니다 그리고 확률변수 X는 15온스 이상이고 17온스 이하라고 합시다 이 문제를 위해서 말이죠 이 조건은 나중에 직관을 세우기 더 쉽게 해 줄 겁니다 이제, 별도의 문제로 그릇을 하나 생각해 봅시다 모두 같은 사이즈의 그릇을 고려합니다 그릇은 4온스라고 합시다 Y의 기댓값을 구하기 위해 만약 임의의 그릇을 고른다면 항상 같은 종류의 그릇을 말이죠 또는 만약 누군가 Mathies로 채운 그릇을 고른다면 또는 만약 누군가 Mathies로 채운 그릇을 고른다면 그 그릇안에 채워진 Mathies의 기댓값은 4온스가 됩니다 하지만 다시 누가 그릇을 채우고 어떻게 채웠는지 그릇을 채우기 전에 흔들었는지에 따라 무게에 변동이 있을 수도 있습니다 어떤 이유에서던지 여기에 변동을 만들 수 있습니다 그러면 이 문제를 위해 이 변동을 측정한 결과 표준편차가 0.6온스였다고 합시다 그리고 누가 그릇을 채우든 그리고 누가 그릇을 채우든 엄청 무겁거나 가볍게 채우지 않는다고 하고 만일 그러한 것은 사용하지 않는다고 합시다 그럼 Y가 가질 수 있는 최댓값을 5온스라고 두고 가질 수 있는 최솟값을 3온스라고 둡시다 모든 정보를 합해서 제가 하고 싶은 것은 임의의 Mathies 박스와 임의의 채워져 있는 그릇에 대해 박스와 그릇 무게의 합을 계산하는 것입니다 즉, 제가 생각해보고 싶은 것은 X + Y 입니다 제가 생각해보고 싶은 것은 두 확률변수의 합 입니다 저번 동영상에서 이미 이것의 기댓값은 각 확률변수의 기댓값의 합이라는 사실을 배웠습니다 그러니 이는 곧 X의 기댓값에 Y의 기댓값을 더한 것으로 16 + 4온스를 해서 이 경우에 이 값은 20온스가 됩니다 하지만 표준편차는 어떻게 될까요? 그냥 표준편차를 더해버리면 되는 걸까요? 만약 X+Y의 표준편차를 알고 싶다면 어떻게 하면 될까요? 아쉽게도 두 표준편차를 그냥 더해버릴 순 없습니다 하지만 분산을 더할 순 있습니다 즉, X + Y의 분산은 X의 분산에다가 Y의 분산을 더한 것입니다 그러므로 이 값은 X의 분산과 Y의 분산을 더한 값 입니다 그리고 각각의 확률변수는 독립이라고 가정합니다 여기에 X,Y가 독립이라는 가정을 대문자로 써 둡시다 추후의 동영상에서는 왜 이 가정이 성립하여야만 이 식이 참이 되는지에 대한 조금 더 나은 직관적 설명을 해 보겠습니다 조금 더 나은 직관적 설명을 해 보겠습니다 이걸 여기서 증명하진 않을 것입니다 하지만 약간의 직관적 설명은 드리겠습니다 여기, 각각의 확률변수에 대해 각 확률변수가 가질 수 있는 온스의 범위를 잡았습니다 그리고 이는 두 변수에 모두 적용됩니다 하지만 둘의 합은 어떨까요? 여기 X + Y는 얼마나 커질 수 있을까요? 이렇게 써 봅시다 X+Y 이게 가질 수 있는 최댓값은 얼마일까요? 만약 각각이 최고로 무겁다면 17+5가 됩니다 그러므로, 22보다 작게 됩니다 같을 수도 있겠죠 그러면 가벼운 경우는 어떨까요? 여기서 15온스를 얻고 여기서 3온스를 얻어 총 18온스가 됩니다 봅시다 이제 합의 변동이 더 커졌습니다 합이 나올 수 있는 범위의 크기는 4인 반면 각각이 나올 수 있는 범위의 크기는 2밖에 되지 않습니다 또한 이걸 다르게 보는 방법은 이 범위의 상한과 하한이 평균보다 먼 정도가 여기의 범위의 상한과 하한이 평균보다 먼 정도보다 크다고도 볼 수 있습니다 이게 이해하는 데 도움이 됐으면 좋겠네요 이제 다른 질문을 던져보죠 만약 제가 X - Y의 분산이 X - Y의 분산이 얼마냐고 묻는다면 어떨까요? 어떤 값이 될까요? 각각의 분산을 그냥 빼버리면 되는 걸까요? 위와 같은 방법을 써 봅시다 X에서 Y를 빼봅시다 그리고 생각해 봅시다 X - Y가 가질 수 있는 가장 작은 값은 무엇일까요? 가장 작은 값이 되려면 X가 작은 값을 갖고 Y가 큰 값을 가지면 됩니다 그렇기에 15 - 5를 해서 10이 나오게 됩니다 이게 나올 수 있는 가장 작은 값입니다 가장 큰 값은 어떻게 될까요? X가 큰 값을 가지고 Y가 작으면 됩니다 그러니 17에서 3을 뺀 14가 나옵니다 자, 보세요 합을 할 때와 똑같이 차의 경우에도 변동성이 증가했습니다 여기서도 여전히 차이의 평균에서 극값까지가 더 멀어진 걸 볼 수 있습니다 차이의 평균은 16 - 4를 해서 12입니다 이 두 극값은 12로부터 멀리 떨어져 있습니다 이는 직관적인 이해를 위한 것이지 이건 엄밀한 증명이 아닙니다 그렇지만 이는 두 경우 모두 성립합니다 X + Y 혹은 X - Y의 분산을 구하려 할 때 X와 Y가 독립이라는 가정아래 두 분산의 합을 구하면 됩니다 이제 이걸 바탕으로 X + Y의 표준편차를 구해 봅시다 X + Y의 표준편차를 구해 봅시다 이것은 이미 알고 있습니다 시그마 기호를 사용합시다 X + Y의 분산을 나타내는 또 다른 방법 중 하나는 X + Y의 분산을 나타내는 또 다른 방법 중 하나는 X+Y의 표준편차를 제곱하는 것입니다 그리고 이건 X의 분산에 Y의 분산을 더한 것과 같습니다 X의 분산은 무엇일까요? 그건 X의 표준편차를 제곱한 것입니다 0.8² 즉 0.64입니다 즉 0.64입니다 Y의 표준편차는 0.6이므로 분산을 얻기 위해 제곱하면 0.36이 나옵니다 두 값을 더하면 1을 얻을 수 있습니다 즉, 분산의 합은 1이고 이 식의 양쪽에 제곱근을 씌우면 합의 표준편차를 구할 수 있습니다 바로 1이 되겠죠 분산이 1인 경우를 다뤘기에 분산이 1인 경우를 다뤘기에 표준편차도 1이 나왔습니다 이게 직관을 세우는데 도움이 되길 바랍니다 독립인 확률변수들을 더하거나 뺄 때 합이나 차의 분산과 변동성은 증가하게 됩니다 다음 동영상에서는 이게 왜 독립일 때 성립하는 것인지 그 이유에 대한 좀 더 깊은 얘기를 해 보도록 하겠습니다