If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

정규분포 문제: 경험법칙 (ck12.org 에서 인용)

경험법칙 (또는 68-95-99.7 법칙)을 사용하여 정규분포의 확률을 예상해 봅시다. 만든 이: 살만 칸 선생님

동영상 대본

정규분포 문제를 하나 더 풀어봅시다 Ck12.org 의 AP 통계학 교재에서 발췌한 문제입니다 누구나 볼 수 있게 공개된 자료이기 때문에 사용하도록 하겠습니다 교재가 상당히 괜찮습니다 교재에 실린 문제가 우리에게 좋은 연습이 될 거에요 자 이제 2번문제를 보도록 하죠 참고로 아까 말한 사이트에 들어가서 교재를 다운받을 수도 있습니다 미국에 사는 한 살배기 여아의 평균 몸무게가 평균이 9.5g인 정규분포를 띠고 있다고 가정합시다 아, g이 아니라 kg이어야겠군요 제가 10개월 된 아들이 있는데 몸무게가 20파운드 정도 나가거든요 kg으로 따지면 9kg정도 되겠네요 9.5g 은 너무 작죠 쥐의 무게를 잰다면 모를까 사람 몸무게니까 단위는 당연히 kg 이어야 하겠네요 어쨌든, 평균값 9.5kg에 표준편차는 1.1g이라고 합시다 이를 식으로 나타내면 평균은 9.5kg이고 표준편차는 1.1g 이 되겠네요 '이 때, 계산기를 사용하지 않고 다음 각 기준을 충족하는 미국에 사는 한 살배기 여아들의 확률을 추정하여 구하시오' 가 문제입니다 여기에서 '계산기를 사용하지 않고 추정하라' 는 말은 우리에게 아주 큰 힌트죠 바로 경험법칙을 적용하라는 힌트를 준 겁니다 다른 말로 68, 95, 99.7 법칙이라고도 해요 여러분이 만약 이 법칙의 이름을 기억한다면 이 법칙의 내용을 기억하고 있는 것과 다름없습니다 이 법칙이 말해주는 사실은 정규분포와 관련이 있어서 문제를 풀기 전에 정규분포를 복습하도록 하겠습니다 정규분포가 있다고 치면 이렇게 생긴 곡선이죠 이렇게 생겼습니다 자, 여기 정규분포 곡선이 있습니다 사실 대칭으로 그려야 하지만 어떻게 생겼는지 대충 아실겁니다 이 점이 평균값입니다 여기 평균값이 있습니다 그리고 평균보다 표준편차만큼 오른쪽으로 떨어지고 표준편차만큼 왼쪽으로 떨어진 지점이 있습니다 고로 이 지점은 평균과 표준편차의 합이 되는 것이고 이 지점은 표준편차와 평균의 차가 됩니다 이 때 완벽한 정규분포 곡선 상에서, 우리가 평균으로부터 각각 표준편차만큼 떨어져 있는 구간에서 어떤 일이 발생할 확률을 구한다고 한다면 그러니까 빗금 친 이 구간에서 말입니다. 답은 예상하셨다시피 68%입니다 다시 말해, 평균으로부터 표준편차만큼 떨어진 구간 내에서 어떤 일이 일어날 확률은 68%라는 겁니다 평균의 오른쪽이든 왼쪽이든 상관없이 말입니다 그렇다면 이번에는 평균으로부터 표준편차의 두 배씩 떨어졌다고 가정해 봅시다 자 이렇게 왼쪽으로 표준편차의 두 배만큼 가고 오른쪽으로도 표준편차의 두 배만큼 떨어졌다고 생각해 봅시다 그렇다면 한 번 질문을 던져보도록 하죠 저 구간 내에서 어떤 일이 일어날 확률이 과연 몇 퍼센트나 될까요? 짐작하셨다시피, 95%입니다 이 구간은 아까 빗금 친 부분도 포함합니다 그러므로 68%는 95%에 포함되는 것이죠 이제 어느정도 감이 오셨을 것이라고 생각합니다 만약 평균으로부터 표준편차의 세 배씩 떨어지게 된다면 그 구간에서 어떤 일이 일어날 확률은 경험법칙, 혹은 68, 95, 99.7 법칙을 통해 99.7%라고 추측할 수 있습니다 다시 말해, 정규분포 상에서 평균에서 왼쪽으로 표준편차 세 배와 평균에서 오른쪽으로 표준편차의 세 배씩 떨어진 구간에서 어떤 일이 일어날 확률은 99.7%라는 것입니다 그게 바로 실증적 규칙이 나타내는 것입니다 그렇다면 이것을 문제에 적용해 보도록 하겠습니다 문제에서 평균과 표준편차가 주어졌습니다 한번 그려보도록 하죠 우선 축을 최대한 잘 그려보겠습니다 여기 축이 있습니다 이제 곡선을 그리도록 하겠습니다 이제 곡선을 그리도록 하겠습니다 최대한 잘 그려보죠 이게 최대한 잘 그린겁니다 그리고 대칭축을 기준으로 좌우 높이가 같아야 합니다 저는 컴퓨터가 아니므로 완벽하게 그릴 수는 없지만요 평균값이 9.5라고 나와있네요 단위는 쓰지 않겠습니다 이미 kg이라는 사실을 알고 있으니까 말이죠 평균으로부터 오른쪽으로 표준편차만큼 떨어져 있으므로 1.1을 더해야 합니다 왜냐하면 표준편차가 1.1이라고 주어졌으니까요 그럼 이 지점은 10.6이 되겠군요 점선을 그려보겠습니다 평균 왼쪽으로 표준편차만큼 떨어진 지점은 9.5에서 1.1을 빼야합니다 그럼 값은 얼마가 될까요? 8.4가 되죠 만약 평균 오른쪽으로 표준편차의 두 배만큼 떨어진 지점이라면 여기서 표준편차만큼 더할 수 있습니다 그렇게 된다면 11.7이 되겠죠 만약 평균 오른쪽으로 표준편차의 세 배만큼 간다면 1.1을 또 더해야 합니다 그리하여 12.8이라는 값이 나오게 됩니다 그렇다면 이번엔 왼쪽도 해보도록 하죠 왼쪽으로 표준편차만큼 가면 8.4가 됩니 표준편차의 두 배만큼 가면 8.4에서 1.1을 뺀 값이므로 7.3이 되겠군요 평균에서 왼쪽으로 표준편차의 세 배만큼 가면 이 지점은 6.2kg이 됩니다 설정은 다 했습니다 문제를 볼까요? 미국에 사는 한 살배기 여자아이의 몸무게가 8.4kg이하일 확률은 얼마입니까? 몸무게보다는 질량이라고 하는 게 더 맞겠죠 아무튼, 이 그래프를 보시면 한 살 짜리 여자아이의 질량 혹은 몸무게가 8.4kg보다 작으려면 지금 빗금치고 있는 이 구간에 해당합니다 제가 질량이라고 한 이유는 kg은 질량을 나타내는 단위이기 때문입니다 물론 대부분 무게의 단위로 쓰죠 이 구간입니다 경험법칙을 사용하여 이 구간의 값을 구하면 어떻게 될까요? 우리는 이 구간 평균으로부터 표준편차만큼 떨어진 영역이 무엇을 의미하는지 알고 있습니다 68%의 확률을 의미합니다 그렇다면 이 영역 밖의 구간은 68%가 아니라는 뜻이므로 32%가 됩니다 왜냐하면 정규분포 곡선 아래 전체 영역은 100, 100%, 혹은 1로 표현할 수 있기 때문입니다 아무리 확률이 커도 총 합이 1을 넘을 수는 없습니다 즉 100%를 넘어가는 확률이란 있을 수 없다는 거죠 그래서 이것에 속하지 않는 부분은 이 왼쪽과 오른쪽 영역이 되겠고 그 영역에서 어떤 일이 일어날 확률은 100-68=32%입니다 즉, 왼쪽 영역과 오른쪽 영역을 합친 것이 32%라는 얘기가 됩니다 그리고 이 곡선은 문제에도 써 있듯이 정규분포 곡선이므로 완벽한 좌우대칭을 이루고 있습니다 따라서 왼쪽과 오른쪽을 더한 값이 32라는 뜻은 결국 좌우 대칭이기 때문에 왼쪽과 오른쪽은 같은 값을 지닌다는 얘기가 됩니다 그렇기 때문에 제가 지금 분홍색으로 칠하는 영역 오른쪽 영역은 16%의 값을 가지고 왼쪽 영역 또한 마찬가지로 16%의 값을 가집니다 따라서 평균+표준편차 이상의 값을 가질 확률은 이 오른쪽 영역에 해당하므로 16%가 됩니다 아니면 평균값-표준편차 이하의 값을 가질 확률은 이 영역에 해당하므로 역시 16%가 되겠죠 문제의 조건은 몸무게가 8.4kg 이하일 확률을 구하는 것이므로 바로 이 영역, 즉 16%가 답이 됩니다 그럼 Part A의 답은 16%이네요. 조건 B로 넘어가 보겠습니다 7.3kg과 11.7kg 사이에 있을 확률을 구해야 합니다 평균 왼쪽으로 표준편차의 두 배만큼 떨어진 곳에 있네요 11.7은 평균 오른쪽으로 표준편차의 두 배만큼 떨어진 곳에 있군요 결국 이 문제가 묻고자 하는 것은 표준편차 두개와 평균의 확률이 어떻게 되는지 입니다 여기 이렇게 평균값이 있고 이 지점은 평균-표준편차의 두 배이고 이 지점은 평균+표준편차의 두 배이네요 음, 바로 알 수 있을 것 같군요 경험법칙에 의하면 두 구간에서는 어떤 일이 일어날 확률이 95%입니다 두 표준편차에서요 경험법칙에 의해 답을 찾을 수 있었네요 이제 마지막으로 Part C를 풀어보겠습니다 미국에 사는 1세 여아 몸무게가 12.8kg 이상일 확률을 구해야 합니다 12.8kg는 그래프 상에서 평균+ 표준편차의 세 배 입니다 12.8kg는 그래프 상에서 평균+ 표준편차의 세 배 입니다 즉, 우리는 평균+표준편차의 세 배 이상인 구간에서의 확률을 구하고자 하는 것입니다 구하고자 하는 구간은 제가 주황색으로 칠한 부분이에요 비교하기 위해서는 다른 색으로 칠할 걸 그랬죠? 지금 오른쪽에 보이는 긴 구간입니다 이 구간에서의 확률을 구해야 합니다 그럼 다시 경험법칙을 이용해 봅시다 우리는 이 영역, 바로 평균- 표준편차의 세 배와 평균+표준편차의 3배 사이 구간에서의 확률은 이미 알고 있습니다 마지막 문제이기 때문에 이 구간에 색을 칠해보도록 하겠습니다 그러면 이 영역에서의 확률은 99.7%가 된다는 것을 알고있죠 그러면 거의 다라고도 할 수 있겠네요 그렇다면 이 영역에 포함되지 않는 부분은 무엇일까요? 양쪽이 있다는 사실을 기억하세요 그 중 하나입니다 그럼 여기 표준편차의 세 배보다 작을 때의 결과가 있겠네요 여기 이 부분이죠 즉, 그래프를 보면, 평균값-표준편차의 세 배 이하인 부분과 평균+표준편차의 세 배 이상인 부분을 더하여 나머지 영역이 되는 것이네요 0.3%밖에 되지 않습니다 아까 그래프는 좌우대칭이라고 했으므로 왼쪽과 오른쪽은 같은 값을 가지고 있어야 합니다 따라서 오른쪽 영역은 이것의 절반인 0.15%, 그리고 왼쪽 영역도 마찬가지로 0.15%가 됩니다 그러므로 미국에 사는 한 살배기 여자아이의 몸무게가 12.8kg 이상일 확률은, 정규분포 곡선 상에서 바로 이 영역, 그러니까 평균+표준편차의 세 배 이상인 부분을 말하는 것이므로 0.15%가 됩니다 도움이 되었길 바랍니다