If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

유효한 신뢰구간에 필요한 조건

유효한 신뢰구간에 필요한 조건.

동영상 대본

이 동영상에는 신뢰구간에 대해 좀 더 알아보겠습니다 이 동영상에는 신뢰구간에 대해 좀 더 알아보겠습니다 다른 동영상들에서는 신뢰구간을 계산하고 해석해보았습니다 이 동영상에서는 알맞게 가정하는 것에 대해 알아보겠습니다 이 동영상에서는 알맞게 가정하는 것에 대해 알아보겠습니다 신뢰구간에 대한 신뢰성을 가질 수 있게 말이죠 혹은 신뢰구간을 문맥에 맞게 올바로 계산했는지 확인할 수 있도록이요 혹은 신뢰구간을 문맥에 맞게 올바로 계산했는지 확인할 수 있도록이요 약간의 복습을 해 봅시다 신뢰구간에 대한 것 중 대다수는 모수를 추정하는 것입니다 그 값이 비율이라고 해 봅시다 특정 후보에 대한 지지율일 수도 있죠 모든 개개인을 조사할 수 없으므로 표본을 추출하여 조사합니다 그 표본으로부터 표본비율을 계산합니다 이 표본비율을 이용하여 신뢰구간을 계산합니다 그 표본비율에 특정 값을 더하고 빼서 말이죠 만약 이것을 굉장히 여러 번 반복한다면 매번 할 때마다 표본 비율의 값이 달라질 가능성이 높습니다 이것을 표본비율 1 이것을 표본비율 2라고 합시다 매번 표본을 추출할 때마다 여기가 표본비율 2였죠 신뢰구간의 중앙값이 달라질 뿐만 아니라 신뢰구간의 중앙값이 달라질 뿐만 아니라 오차범위 또한 달라집니다 왜냐하면 표본비율의 값이 달라지기 때문이죠 이 때 첫 번째로 사실이어야 하는 것은 이 신뢰구간에 대해 어떠한 주장을 하려고 하면 표본이 임의의 표본이어야 한다는 것입니다 표본이 임의의 표본이어야 한다는 것입니다 만약 특정 후보에게 투표한 사람들의 실제 비율을 추정하려고 하는데 노인 층을 대상으로만 설문조사를 한다면 그것은 임의의 표본이 아니죠 대학생들만을 조사하는 것도 마찬가지로 임의의 표본이 아닙니다 통계학에서 항상 그렇듯이 임의의 표본을 사용하는지 꼭 확인해야 합니다 임의의 표본을 사용하는지 꼭 확인해야 합니다 아주 잘 확인하세요 두 번째로 확인해야 할 것은 이 분포가 정규분포를 따른다는 것입니다 이 분포가 정규분포를 따른다는 것입니다 기억해 두세요 신뢰구간의 기초는 표본비율의 분포가 표본비율의 분포가 표본비율의 표본분포가 이와 같이 근사적으로 정규분포를 따른다고 가정하는 것에 있습니다 근사적으로 정규분포를 따른다고 가정하기 위해서는 근사적으로 정규분포를 따른다고 가정하기 위해서는 정규분포 조건을 만족해야 합니다 여기서 가장 중요한 것은 각각의 표본에 대해 10번보다 많은 성공과 각각의 표본에 대해 10번보다 많은 성공과 10번보다 많은 실패가 있어야 한다는 것입니다 10번보다 많은 실패가 있어야 한다는 것입니다 예를 들어 표본크기가 10밖에 되지 않는다면 실제 비율이 50%, 0.5라고 할 때 정규분포 조건을 만족하지 못합니다 왜냐하면 각각의 표본에 대해 5번의 성공과 5번의 실패가 예측되기 때문입니다 이제, 보통 신뢰구간에 대해 다룰 때 모수에 대해서는 알지 못하기 때문에 어떻게 하냐면 추출한 표본들을 보고 얼마나 많은 성공과 실패들이 있는지 세어 보아야 합니다 그 중 10번보다 작은 것이 있다면 문제가 되겠죠 그 중 10번보다 작은 것이 있다면 문제가 되겠죠 그러므로 성공과 실패가 각각 최소 10번 이상은 되어야 합니다 그러므로 성공과 실패가 각각 최소 10번 이상은 되어야 합니다 사실 예상한다고 말할 필요도 없습니다 왜냐하면 표본을 추출해서 성공이 몇 번이고 실패가 몇 번인지 세어보기만 하면 되니까요 그렇지 않다면, 정규분포 조건이 만족되지 못하므로 신뢰구간을 계산하는 데 있어서 필요한 가정들이 유효하지 못하게 됩니다 마지막으로 확인해야 할 것은 독립 조건이라는 것입니다 독립 조건이라는 것입니다 그리고 이것은 10% 규칙입니다 비복원추출을 한다면 복원추출을 하기가 힘들 때도 있죠 예를 들어 가게 문을 나서는 사람들을 대상으로 설문조사를 하면 예를 들어 가게 문을 나서는 사람들을 대상으로 설문조사를 하면 그 사람들을 다시 가게 안으로 들어가 달라고 하는 것은 매우 어색한 일이 될 것입니다 독립 조건이 의미하는 것은 표본의 크기, 즉 n이 모집단 크기의 10%보다 작아야 한다는 것입니다 모집단이 100,000명으로 구성되어 있다고 합시다 1000명을 조사한다면 그것은 전체 인구의 1%이므로 이 조건을 만족한다고 생각할 수 있습니다 이 조건을 만족한다고 생각할 수 있습니다 그리고 이것은 비복원추출일 때 중요합니다 그리고 이것은 비복원추출일 때 중요합니다 이중에 만족되지 않은 조건이 있다면 이중에 만족되지 않은 조건이 있다면 구한 신뢰구간이 제대로 작동하지 않는다는 것을 확인해 보겠습니다 마지막 두 개의 조건에 초점을 맞추어 보겠습니다 임의 표본 조건은 통계학 전반에서 굉장히 중요한 조건입니다 먼저 독립 조건이 성립하지 않는 상황을 봅시다 여기서 보는 것처럼 사탕 뽑기 기계 시뮬레이션을 생각해 볼게요 사탕 뽑기 기계 시뮬레이션에서 실제 모비율이 있지만 표본을 추출하는 사람은 모비율을 알지 못할 수 있습니다 95% 유의수준의 신뢰구간을 찾고자 합니다 95% 유의수준의 신뢰구간을 찾고자 합니다 그리고 비복원추출을 합니다 그러므로 표본 내의 각각의 개체를 확인한 후 다시 표본 안에 집어넣지 않습니다 200개의 표본을 추출해 볼게요 그런 다음 모집단의 크기를 조절하여 표본의 크기가 모집단 크기의 10%가 넘도록 해 볼게요 그런 다음 표본을 뽑아 봅시다 표본 크기는 200이고 거의 1500번 표집하였습니다 표본 크기는 200이고 거의 1500번 표집하였습니다 여기 보이는 것은 모비율이 이 신뢰 구간 내에 포함되어 있는 경우를 나타냅니다 모비율이 이 신뢰 구간 내에 포함되어 있는 경우를 나타냅니다 이 표본에 대해 계산한 신뢰구간 말입니다 여기 빨간색은 그렇지 않은 경우들입니다 보이는 바와 같이 신뢰구간 내에 모비율이 포함되는 경우는 전체 경우의 93%에 해당합니다 그리고 표본은 충분히 여러 번 추출되었습니다 만약 이 신뢰구간이 정말 95% 신뢰구간이라면 모비율이 신뢰구간 내에 포함되는 경우는 95%여야 합니다 이번에는 정규분포 조건이 성립되지 않는 상황을 보죠 이번에는 정규분포 조건이 성립되지 않는 상황을 보죠 이 경우 표본의 크기는 15입니다 조금만 더 내려 보면 경고가 나오기까지 합니다 예측된 성공이 10번보다 적으니까요 그러면 제가 이렇게 여러 번 표본들을 추출하면 2000번 추출해 보겠습니다 그러면 신뢰구간을 설정해 놓아도 계산해 볼 때마다 확률이 95%가 되어야 하지만 여기서 보여지는 것은 94%입니다 그리고 저는 충분히 표본을 여러 번 추출했습니다 따라서 임의의 표본이 아닌 경우에도 잘못되는 것이 많지만 실제 표본비율의 표본분포가 정규 분포를 따르지 않거나 실제 표본비율의 표본분포가 정규 분포를 따르지 않거나 실제 표본비율의 표본분포가 정규 분포를 따르지 않거나 또는 표본의 크기가 모집단의 크기에 비해 너무 큰 것 같은데 비복원추출도 아니어서 독립 조건이 유효하지 않다면 여러분이 계산한 신뢰구간은 유효하지 않을 수도 있습니다 여러분이 계산한 신뢰구간은 유효하지 않을 수도 있습니다 여러분이 계산한 신뢰구간은 유효하지 않을 수도 있습니다