If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

정규분포 (ck12.org 에서 인용)

어떤 분포가 얼마큼 "정규분포"를 따르는지에 대해 알아봅시다. 만든 이: 살만 칸 선생님

동영상 대본

정규분포는 아무리 연습해도 지나치지 않아요 나머지 통계학의 매우 중요한 구성요소이자 여러분의 삶에도 정말 중요하니까요 여기 예제 문제가 있는데요 ck12.org라는 오픈소스 플렉스 책에 나와요 AP 통계학 플렉스 책이죠 정규분포 챕터에서 문제를 뽑았습니다 실제로 사이트에 가서 이 예제들을 볼 수 있죠 첫 번째 문제는 다음 중에서 정규분포에 가장 가까운 것은 뭘까요 정규분포가 아니라면 그 이유를 설명해 보세요 선택하는 겁니다 제가 생각해 보는데요 수학에서는 특이한 겁니다 이건 뭐랄까, 뭐죠? 에세이 질문 같은 거예요 무슨 문제가 있나 봅시다 A. 한 뼘의 길이 엄지 끝에서부터 다섯째 손가락 끝까지 잰 것 이것이 뭐냐면 손을 그릴 수 있나 볼게요 검지 손가락 중지 손가락 약지 손가락하고 새끼 손가락이죠 손이 이렇게 생겼죠 이 길이를 말하는 거겠죠 엄지 손가락의 끝에서 쭉 편 다섯째 손가락까지죠 새끼 손가락을 멋지게 한 말이네요 바로 이 길이입니다 고3학생들을 무작위로 뽑아서 이 길이를 잰다면 결과가 어떨까요? 어느 정도인지 여러분이 알 거예요 유전과 환경적 요인, 즉, 우유를 얼마나 마셨는지 자라면서 철봉에 새끼 손가락으로 얼마나 매달려 봤는가 하는 조합이죠 이건 엄청난 무작위 수의 합이라고 생각해요 그러니까 대략 정규분포라고 생각해요 제 손을 보면 고등학교 이후로 그렇게 자란 것 같지 않거든요 대략 9인치(약 23cm) 정도인 것 같아요 전 기타치거든요 아마 손 늘리는데 도움이 됐을 거예요 하지만 상당히 에세이 같은 질문이에요 그래서 느낌을 얘기하는 거죠 그러니까 분포는 이런 식이 될 겁니다 잘 모르겠어요 이런 건 해본 적이 없어서요 8-9인치의 중간 정도 되지 않을까요 이렇게 분포할 거고요 이런 식으로 분포합니다 아마 정규분포처럼 생길 거예요 하지만 완벽하진 않겠죠 분명한 건 완전한 정규분포는 아닐 겁니다 한 뼘의 길이가 음수인 사람은 없을테니까요 이 길이는 음수가 될 수 없어요 제 생각에는 손이 없을 수 있으니까 그건 0으로 하죠 분포곡선은 음수 영역에는 없을 거예요 그러니까 완전 정규분포는 아닐 겁니다 왼쪽에서는요 0에서 끝나게 될 거예요 오른쪽에서도 신체적으로 불가능한 손 길이가 있죠 아무도 대기권의 높이나 천문학적 단위만큼 손이 큰 사람은 없죠 태양에 손이 닿겠네요 신체적으로 불가능한 지점이 있어요 실제 정규분포에서는 만약 동전 던기지를 한다면 아주 아주 적은 확률로 백만 번 연속 앞면이 나올 수도 있어요 그런 확률은 거의 0이죠 하지만 확률은 있죠 한뼘의 경우는 그런 경우가 없어요 어떤 사람이 고3인데 한뼘이 1마일(약 1.6km)일 확률은 0이죠 그래서 완전 정규분포가 안 되는 거예요 예외와 평균에서 계속 멀어지는 그런 거죠 하지만 실생활에서는 어림잡아 보면 대략 맞아요 정규분포는 분포도를 대략 추정하기 좋아요 한 가지 재미있는 것은 고3학생들을 대상으로 했을 때 제 입장에서는 남학생인 거예요 고3 남학생이면 여학생보다는 손이 더 크겠죠 어쩌면 이중 분포가 되겠네요 이런 것 말고도 이런 분포가 가능하겠죠 8인치 정도되는 남학생 그래프죠 7인치 정도는 여학생이겠군요 분포도는 이런 모양으로 내려갑니다 이것도 이중 분포가 가능하네요 보통 정규분포는 문제의 A에 잘 맞는 추정치가 될 거예요 B에 어떤 문제가 있나 봅시다 대형 택배회사의 모든 직원의 연봉 연봉이라고 하면 최저임금법 이런 게 있죠 어떤 회사든지 적어도 정규직을 말하는 거겠죠 그럼 최저임금을 받을 겁니다 아마 많은 사람들이 최저임금을 받겠죠 노동집약적 일이니까요 대부분의 사람들이 끝의 낮은 범위에 있을 거예요 여러 중간 관리자와 다른 직급이 있겠죠 그럼 이런 큰 차이가 있을 거예요 실제 경영자가 있겠죠 CEO나 그런 사람이요 이게 평균이라면 여기 연봉 4만 달러 쯤 되고 8만 달러는 아마 중간급 관리자가 되겠죠 여기는 사실 현실적으로 그린다면 20만 달러 정도가 CEO에 적합한 연봉이겠네요 하지만 실제로는 여기서 훨씬 더 나갑니다 이 정도 될 거예요 표 밖으로 나갈 거예요 CEO가 연봉 5백만 달러라고 합시다 주식 옵션같은 걸로도 받으니까요 그럼 이 정도 될 거예요 CEO와 CFO, 창업자 같은 사람들도 있죠 제 생각엔 분병히 정규분포가 안 될 거라고 봐요 이중 분포가 될 거예요 상급 관리자에 이쪽 값이 있고 유럽에서 일한다면 왼쪽에 가까을 거예요 그래도 완전 정규분포는 안 됩니다 최저 임금 같은 어떤 제한선 아래 값은 없을 거예요 제가 보기에는 왼쪽보다 오른쪽으로 길어지는 비대칭 분포가 될 거예요 우측 비대칭 분포요 저기에 봉이 두 개니까 이것도 이중 방식입니다 회사 종류에 따라 다르겠죠 제 추측으로는 많은 택배 회사의 연봉이 이럴 거예요 선택지 C나 문제 C를 봅시다 무작위로 뽑은 남녀 각 25명의 주요 기업 50명의 CEO 연봉 문제가 올해 것이니까 아마도 연봉의 성차이가 완전히 없어진 건 아님을 보여주는 거겠네요 연봉의 차이가 있죠 그저 주요 기업 CEO 50명이라고 하면 아마 정규 분포에 가까울 거예요 이런 모양일 거예요 CEO라면 일하지 않을 수준도 있고요 어떤 경우에는 돈도 안 받고 일하기도 한다는 걸 들어봤겠죠 하지만 다른 방식으로 돈을 받습니다 그런 경우를 다 포함시키면 기본급이라는 게 있을 거예요 모든 CEO가 최소한 받는 액수죠 그리고 최대한의 수준으로 값이 올라갑니다 오른쪽에 긴 꼬리가 생기겠네요 성차이가 없다면 이럴 겁니다 우측 비대칭분포가 됩니다 오른쪽에 긴 꼬리가 생기죠 성차이가 있다고 봅시다 그럼 봉이 두 개 생기겠죠 이중 분포가 되는 겁니다 성차이가 있다고 가정하면 여기 C부분에서 여성에 해당하는 봉이 있을 거예요 여성이 남성보다 적게 번다고 하면 남성에 해당하는 봉이 있죠 25명씩이라고 했으니 남자가 더 많은 건 아니죠 그럼 오른쪽으로 쭉 뻗어 나갑니다 제 생각에는 여러분 이런 생각도 할 거예요 수 백만 달러를 버는 초특급 CEO가 있죠 대부분 CEO는 대략 말하자면 "겨우 몇 십만 달러" 벌겠지만요 그럼 부분적으로 표준편차가 한참 벗어난 부분이 있을 거예요 이런 경우는 삼중 분포가 될 겁니다 선택지C와 A가 정규분포에 가장 가까운 선택지가 되겠네요 D를 살펴볼까요 편의점 현금출납기에서 꺼낸 100개 페니 동전의 연도 100페니요 참 재미있는 실험이네요 다시 한번 생각해 보면 이런 문제는 제 느낌을 말해야 하네요 답이 합리적이기만 하면 맞다고 생각해요 대부분 페니는 새 동전이에요 사실상 잘 안쓰이니까요 거래에서 안 쓰이죠 시간이 지나면서 닳고 분실되거나 관광상품으로 납작하게 하고 기념품으로 만들죠 합법적이기나 한지 모르겠어요 합법적으로 할 수 있다면요 그럴 계획이 있다면 엄청난 페니 동전이 있어야겠죠 지난 몇 년간 100개 페니 동전의 연도가 나이 말고요, 이게 2010년이면 아마도 2010년 페니 동전은 못 찾을 거예요 2009년도 동전은 많이 찾을 겁니다 그럼 2009년부터 내려갈 거예요 물론 미국보다 더 오래된 동전은 못 찾겠죠 페니를 찍어내기 이전도 안되죠 그럼 왼쪽으로 무한정 뻗을 순 없겠네요 제 생각엔 좌측 비대칭 분포가 될 것 같아요 좌측 비대칭 오른쪽에 잔뜩 몰려있지만 선이 왼쪽으로 쭉 가겠죠 그래서 좌비대칭분포라고 하는 겁니다 이걸 부적분포라고도 해요 마찬가지로 우측비대칭분포 또는 정적분포라고 하죠 봉이 하나만 있으면요 이런 다중분포는 없습니다 좌비대칭 분포에서 평균값이 중간값 왼쪽에 있죠 이런 경우에는 중간값이 이쯤 어디 있을 거예요 왼쪽에 긴 선이 있기 때문에 평균값은 여기쯤 있을 거예요 마찬가지로 이런 분포에서는 중간값이 이렇게 있을 거예요 하지만 우비대칭이라서 큰 봉 하나만 있습니다 이 봉은 작아서 크게 영향을 주지 않아요 평균값은 오른쪽에 있을 거예요 그래서 이걸 우비대칭 또는 정적비대칭이라고 하죠 답을 구하려면 느낌으로 해야 하죠 다른 선택들은 어째서 안 맞거나 문제 세트들이 정규분포가 아닌지 말하는 거죠 A가 답이라고 하겠지만 이 문제에서는 정말 의견을 묻고 있어요