If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

예제: 분포의 차 분석하기

정규분포변수 차의 분포를 이해하여 임의로 선택된 여성이 임의로 선택된 남성보다 클 확률을 구해 봅시다.

동영상 대본

남자들의 평균 신장이 178cm이고 표준편차가 8cm입니다 표준편차가 8cm입니다 여자들의 평균 신장은 170cm이고 표준편차는 6cm입니다 남자와 여자의 신장은 각각 정규분포를 이룹니다 이때 독립적이고 임의로 남자와 여자를 한 명씩 선택합니다 여자가 남자보다 클 확률은 얼마일까요? 여자가 남자보다 클 확률은 얼마일까요? 잠시 영상을 멈추고 이 문제에 대해서 깊이 생각해 보세요 그러면 제가 힌트를 드릴게요 확률변수 M을 임의로 선택된 남자의 신장으로 정의해 봅시다 확률변수 M을 임의로 선택된 남자의 신장으로 정의해 봅시다 확률변수 M을 임의로 선택된 남자의 신장으로 정의해 봅시다 그리고 확률변수 W를 임의로 선택된 여자의 신장으로 정의해 봅시다 그리고 확률변수 W를 임의로 선택된 여자의 신장으로 정의해 봅시다 그리고 확률변수 W를 임의로 선택된 여자의 신장으로 정의해 봅시다 그리고 확률변수 W를 임의로 선택된 여자의 신장으로 정의해 봅시다 세 번째 확률변수를 앞의 두 확률변수로 나타내 봅시다 좀 다르게 나타내기 위해 D로 쓰겠습니다 D를 임의로 선택된 남자와 여자의 신장 차이로 정의합시다 D를 임의로 선택된 남자와 여자의 신장 차이로 정의합시다 D를 임의로 선택된 남자와 여자의 신장 차이로 정의합시다 따라서 확률변수 D = 확률변수 M - 확률변수 W입니다 처음 두 확률 변수는 확실히 정규분포를 이룹니다 여기에 남자와 여자의 신장은 각각 정규분포를 이룬다고 쓰여있죠 그리고 또한 각각 정규분포를 이루는 확률 변수들의 차이도 그리고 또한 각각 정규분포를 이루는 확률 변수들의 차이도 정규분포를 이룬다는 것을 알고 있습니다 정규분포를 이룬다는 것을 알고 있습니다 이 상태에서 이 문제를 어떻게 풀 수 있을까요? 여자가 남자보다 클 확률 말이죠 그럼 같이 풀어 봅시다 시각적 도움을 위해 이 세 확률변수들의 정규분포 곡선을 그리겠습니다 첫 번째 그림은 확률변수 M에 대한 것이고 여기 중앙이 M의 평균입니다 그리고 이 값이 178cm입니다 여기서 cm 단위만 쓰도록 하겠습니다 그리고 표준편차가 8cm라는 것을 알고 있죠 예를 들어 여기가 표준편차 하나 위이고 여기가 하나 밑이라면 이 점은 바로 178cm보다 8cm가 큰 186cm가 됩니다 여기는 8cm가 작은 170cm가 됩니다 여기까지가 확률변수 M에 대한 것입니다 이제 확률변수 W에 대해서 생각해 봅시다 확률변수 W의 평균은 170cm라고 했고 표준편차 하나 위는 평균보다 6cm가 큰 것입니다 표준편차가 6cm이고 여기는 -6cm이고 평균에서 표준편차 하나 아래입니다 이제 두 확률변수의 차이를 생각해 봅시다 바로 확률변수 D입니다 잠시 생각해 봅시다 확률변수 D의 평균은 이 확률 변수들의 평균의 차이와 같습니다 평균은 이 확률 변수들의 평균의 차이와 같습니다 따라서 D의 평균은 M의 평균 - W의 평균입니다 M의 평균 - W의 평균입니다 이 두 값을 모두 알고 있으므로 178 - 170입니다 적어보도록 하죠 D의 평균 = 178cm - 170cm입니다 D의 평균 = 178cm - 170cm입니다 이는 계산하면 다른 색깔로 쓸게요 다른 색깔로 쓸게요 결국 8cm입니다 따라서 여기는 8이 됩니다 그러면 표준편차는 어떻게 될까요? 이 두 확률변수들이 독립이고 남자와 여자를 독립적이고 임의로 선택했다고 이야기 했으므로 남자의 키가 여자의 키에 영향을 주지 않아야 하고 역으로도 마찬가지입니다 이 둘이 독립인 변수이고 단순히 이 둘의 합이나 차이를 구한다면 분산은 커질 것입니다 하지만 표준편차는 단순히 더할 수 없습니다 실제로 두 변수간 차이의 분산은 두 분산의 합을 통해 구합니다 두 분산의 합을 통해 구합니다 한 번 써보겠습니다 분산을 VAR로 쓰거나 표준편차의 제곱으로도 쓸 수 있습니다 써보겠습니다 D의 표준편차의 제곱 즉 분산은 변수 M의 분산 + 변수 W의 분산입니다 변수 M의 분산 + 변수 W의 분산입니다 여러분의 직관에 반할 수 있습니다 여기에 +가 있으면 이해가 갔을 것이기 때문입니다 하지만 더하든 빼든 상관습니다 이것들은 분명히 독립인 변수들입니다 그러면 이것들이 더해지든 빼지든 상관없이 분산들을 더하면 됩니다 그러면 이것을 계산할 수 있습니다 이것은 변수 M의 표준편차인 8이고 이것은 변수 M의 표준편차인 8이고 8² = 64이고 6² = 36입니다 6² = 36입니다 6² = 36입니다 이 둘을 더하면 100이 됩니다 여기 이 분포의 분산이 100입니다 그러면 이 분포의 표준편차는 몇인가요? 분산의 제곱근을 구하면 됩니다 분산의 제곱근을 구하면 됩니다 √100 = 10입니다 예를 들어 표준편차 하나 위는 18이 됩니다 표준편차 하나 아래는 -2가 됩니다 이제는 이 분포를 이용하여 실제로 문제를 풀 수 있습니다 여자가 남자보다 클 확률은 얼마일까요? 여자가 남자보다 클 확률은 얼마일까요? 이 질문을 다시 써보면 확률변수 D가 어떠한 조건일 확률은 얼마인가 하는 것입니다 잠시 영상을 멈추고 어떤 조건일지 생각해 보세요 여자가 남자보다 큰 경우는 여자가 남자보다 큰 경우는 결국 이 값이 음의 값이어야 합니다 그러면 D는 0보다 작게 됩니다 따라서 결국 구하고자 하는 것은 D가 0보다 작을 확률입니다 0이 이 분포에서 여기에 있다고 하면 0이 이 분포에서 여기에 있다고 하면 이곳이 D가 0이 되는 곳입니다 구하고자 하는 것은 이 0보다 작은 곡선의 아래 면적입니다 따라서 이 전체 면적을 구하면 됩니다 구하는 방법은 두 가지가 있습니다 D가 0이되는 점의 Z-점수를 계산할 수 있는데 간단합니다 Z는 0에서 평균 8을 빼주고 표준편차인 10으로 나누어준 것과 같습니다 계산하면 -8/10이고 이는 곧 -0.8입니다 표준정규분포표를 보고 Z가 -0.8보다 작은 곡선의 아래 면적이 얼마인지 구할 수 있습니다 다른 방법은 그래프를 그려주는 계산기를 이용하는 것입니다 저는 TI-84를 가지고 있습니다 이걸로 정규누적분포함수를 사용할 수 있습니다 2nd와 VARS를 누르면 분포가 뜨고 그러면 다양한 함수를 사용할 수 있습니다 저는 정규누적분포함수를 쓰고 싶으므로 2번을 고르겠습니다 그리고 하한을 정하는데 저는 음의 무한대를 원합니다 그런데 계산기에는 음의 무한대 버튼이 없네요 하지만 음으로 매우 작은 수를 넣으면 음의 무한대와 같은 효과가 나옵니다 따라서 -1x10⁹⁹를 사용할 수 있습니다 그 숫자를 넣으려면 2nd를 누르고 EE를 누르면 10의 몇 제곱을 의미하고 99를 입력합니다 그러면 이 숫자는 매우 작은 음의 숫자가 됩니다 상한을 정하기 위해 기존 숫자를 지워주고 상한을 0으로 정합니다 음의 무한대부터 0까지의 면적을 구해야 하니까요 여기 평균은 이미 계산했습니다 평균은 8이죠 여기 표준편차 역시 이미 계산했고 10입니다 이제 이 enter를 클릭해서 메인 화면으로 돌아옵니다 이것은 사실 메인 화면에 직접 입력할 수도 있었던 것입니다 살펴보면 정규분포가 있고 두 경계 사이의 누적 면적을 구하고자 합니다 이 경우 음의 무한대부터 0까지이고 이 경우 음의 무한대부터 0까지이고 평균은 8 표준편차는 10이죠 enter를 누르면 근사적으로 0.212를 얻습니다 여기가 대략 0.212입니다 이제 여자가 남자보다 클 확률에 대한 답이 나왔습니다 이제 여자가 남자보다 클 확률에 대한 답이 나왔습니다 0.212 혹은 대략 21.2%의 가능성이 있다고 대답할 수 있습니다 즉, 20%보다 조금 높습니다