If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

편향된 표본 통계량 예제

표본분포 예상치를 가지고 통계 표본이 편향되어있는지 판별하는 예제를 살펴봅시다.

동영상 대본

알렉산드로는 자신이 구한 표본들의 중간값이 전체 중간값의 올바른 추정량인지 알고 싶어합니다 전체 중간값의 올바른 추정량인지 알고 싶어합니다 0부터 32까지 번호 붙여진 33개의 탁구공을 0부터 32까지 번호 붙여진 33개의 탁구공을 큰 통에 넣고 잘 섞었습니다 이 때 모집단의 중간값은 16입니다 이 때 모집단의 중간값은 16입니다 그 다음 큰 통에서 임의의 공 5개를 뽑아 그 공들의 중간값을 구합니다 이만큼의 공이 있다고 합시다 모수는 이미 알고 있습니다 모집단의 중간값은 16이었죠 이제 알렉산드로가 이 중에서 공 5개를 뽑습니다 n=5의 상황이고, 이때 표본들의 중간값을 구하는 것입니다 n=5의 상황이고, 이때 표본들의 중간값을 구하는 것입니다 이후에 공들을 다시 통에 넣고 이 과정을 50번 반복한다고 합시다 이후에 공들을 다시 통에 넣고 이 과정을 50번 반복한다고 합시다 이 결과를 다음 점도표에 나타내었습니다 각각의 점은 뽑은 공 5개의 중간값을 의미합니다 각각의 점은 뽑은 공 5개의 중간값을 의미합니다 5개의 공을 뽑았다가 다시 넣는 것을 반복한 것입니다 5개의 공을 뽑았다가 다시 넣는 것을 반복한 것입니다 그리고 이 과정을 여러 번 반복하는데 각각의 시행에서 구한 중간값을 점도표 위에 점으로 나타내었습니다 각각의 시행에서 구한 중간값을 점도표 위에 점으로 나타내었습니다 50번 반복하므로 50개의 점이 찍혔습니다 각각의 점은 뽑은 표본의 통계량입니다 즉 여기 있는 4개의 점은 구한 중간값이 20인 경우가 50회 중 4회였음을 의미합니다 50회 중 5회는 중간값이 10으로 구해졌습니다 50회 중 5회는 중간값이 10으로 구해졌습니다 결국 이렇게 그려진 점도표는 표본들의 중간값에 대한 표본분포의 어림값이 됩니다 표본들의 중간값에 대한 표본분포의 어림값이 됩니다 이제 이 분포가 모집단의 중앙값에 대한 불편추정량인지 편의추정량인지 확인해 보려고 합니다 먼저 영상을 잠시 멈추고 스스로 방법을 생각해 보기 바랍니다 먼저 영상을 잠시 멈추고 스스로 방법을 생각해 보기 바랍니다 이제 함께 해봅시다 먼저 전체 모집단에 대한 올바른 중간값을 확인합시다 먼저 실제 모수가 어디 있는지 확인합시다 먼저 실제 모수가 어디 있는지 확인합시다 실제 모수는 16이고 바로 여기 있습니다 실제 모수는 16이고 바로 여기 있습니다 만약 생각하는 모수가 편의추정량이라면 만약 생각하는 모수가 편의추정량이라면 구한 표본분포의 어림값이 구한 표본분포의 어림값이 편향된 모습을 보일 것을 예상할 수 있습니다 예를 들어 구한 중간값에 대한 표본분포가 예를 들어 구한 중간값에 대한 표본분포가 이런 식으로 그려진다면 편의추정량이라고 생각할 수 있습니다 혹은 이렇게 그려진 경우에도 마찬가지로 편의추정량이라고 말할 수 있습니다 하지만 알렉산드로가 구한 표본분포는 하지만 알렉산드로가 구한 표본분포는 실제값보다 작은 경우와 실제값보다 큰 경우가 대략 비슷한 비율로 나온 것을 확인할 수 있습니다 완전히 똑같아야 할 필요는 없습니다 대략 모양이 비슷하므로 편향되지 않았다고 할 수 있습니다 문제로 돌아가보면 표본의 중간값은 전체 중간값에 대한 불편추정량이라 할 수 있습니다 표본의 중간값은 전체 중간값에 대한 불편추정량이라 할 수 있습니다