If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

오차범위 2

모집단에서 특정 후보에게 투표하는 사람 비율의 95% 신뢰구간을 구해 봅시다. 만든 이: 살만 칸 선생님

동영상 대본

지난 동영상에서는 문제를 드리고 끝났습니다 지난 동영상에서는 문제를 드리고 끝났습니다 어떤 신뢰할 수 있는 구간을 찾는데 왜 이렇게 애매하게 말하는지는 조금 있다가 설명할게요 95% 확률로 표본평균 표본분포의 평균과 같은 실제 모평균 p가 95% 확률로 표본평균 표본분포의 평균과 같은 실제 모평균 P가 95% 확률로 표본평균 표본분포의 평균과 같은 실제 모평균 P가 95% 확률로 표본평균 표본분포의 평균과 같은 실제 모평균 P가 95% 확률로 표본평균 표본분포의 평균과 같은 실제 모평균 p가 여기에 써 볼게요 표본평균 표본분포의 평균과 같은 실제 모평균 P가 있는 구간을 찾는 것이죠 그러기 위해 몇 가지 적어보도록 하겠습니다 어떤 표본의 평균을 내었을 때 그러니까 확률표본평균이 표본평균 표준편차의 그러니까 확률표본평균이 표본평균 표준편차의 두 배 안에 있는 확률은 얼마일까요? 이 확률은 얼마일까요? 분포를 살펴보면요 이게 여기서의 분포이고 이게 표본평균입니다 이게 표본평균입니다 이게 표본평균입니다 이게 표본평균입니다 그러면 확률표본평균이 표준편차 두 배의 안에 있을 확률은 얼마일까요? 확률표본은 이 분포 안의 표본입니다 표본평균 표본분포의 표본이죠 표본평균 표본분포의 표본이죠 평균에서 표준편차 두 배 안에서 표본을 찾을 확률을 묻는 것입니다 평균에서 표준편차 두 배 안에서 표본을 찾을 확률을 묻는 것입니다 표준편차 하나는 여기 두 개째는 여기라고 하죠 표준편차 하나는 여기 두 개째는 여기라고 하죠 이것은 외워두면 좋은데 이것은 외워두면 좋은데 보통 정규분포에서 표준편차의 두 배 안에 있는 표본을 찾을 확률은 95%이고 정확히 말하자면 95.4%입니다 정확히 말하자면 95.4%입니다 대락 95%라고 할 수 있어요 대락 95%라고 할 수 있어요 어느 정도 신뢰할 수 있는 구간이면 되기 때문에 이 정도면 충분합니다 어느 정도 신뢰할 수 있는 구간이면 되기 때문에 이 정도면 충분합니다 표준편차도 추정했으니까요 원한다면 95.%라고 쓸 수도 있지만 원한다면 95.%라고 쓸 수도 있지만 보통 표준편차의 두 배면 95%라고 생각합니다 보통 표준편차의 두 배면 95%라고 생각합니다 이것은 표본분포의 평균이 이것은 표본분포의 평균이 이것은 표본분포의 평균이 표본분포 표준편차의 두 배 안에 있을 확률과 같습니다 표본분포 표준편차의 두 배 안에 있을 확률과 같습니다 95.4%이죠 이 둘은 같은 의미입니다 x가 이것과 표준편차의 두 배 떨어져 있으면 이 평균도 x와 표준편차의 두 배 떨어져 있습니다 같은 것을 다르게 풀어 쓴 것일 뿐입니다 표본분포의 평균과 모집단분포의 평균 그리고 모수P는 모두 같은 것임을 알고 있습니다 그리고 모수 P는 모두 같은 것임을 알고 있습니다 P는 모집단에서 1의 비율이고요 여기 P가 모평균과 같으니까 여기서 이걸 P로 바꿀 수 있습니다 따라서 P가 x에서 표본분포 표준편차의 두 배 안에 있을 확률도 95.4%이죠 이것이 얼마인지는 알지 못하지만 추정치는 구해 보았습니다 그 추정치는 모집단의 실제 표준편차/10 이고 그 추정치는 모집단의 실제 표준편차/10 이고 그 추정치는 모집단의 실제 표준편차/10 이고 모집단의 실제 표준편차는 표본표준편차인 0.5로 추정했습니다 모집단의 실제 표준편차는 표본표준편차인 0.5로 추정했습니다 0.5 /10 이죠 여기서 표본평균 표본분포의 표준편차에 대한 가장 가까운 추정치는 0.05입니다 이제 모집단에서 1의 비율인 모수 p가 표본평균에서 표준편차의 추정치 0.05의 두 배 표본평균에서 표준편차의 추정치 0.05의 두 배 이내에 있을 확률이 95.4%라고 할 수 있습니다 다시 말하면 평균에서 P가 2x0.05, 곧 0.1 다시 말하면 평균에서 P가 2x0.05, 곧 0.1 이내에 있을 확률이 95.4인 것이고 조심해야 할 것은 더이상 등호를 사용할 수 없는데 여기 이 표본평균 표본분포의 표준편차를 알았다면 여기 이 표본평균 표본분포의 표준편차를 알았다면 95.4%라고 할 수 있지만 알지 못하고 가장 가까운 추정치를 찾은 것이기 때문입니다 그래서 여기서는 거의 같다고만 할 수 있습니다 그리고 이것의 정확도에 대비해서 95%라고 하겠습니다 95%임을 신뢰할 수 있는 것이죠 표본에서 얻은 추정치를 사용했고 표본이 정말 치우쳐져 있다면 이것도 이상한 수가 될 테니까요 표본이 정말 치우쳐져 있다면 이것도 이상한 수가 될 테니까요 정확한 단어를 사용해야 하는 이유입니다 정확한 단어를 사용해야 하는 이유입니다 이것은 결과가 적어도 얼마나 괜찮은지 알려줍니다 이것은 결과가 적어도 얼마나 괜찮은지 알려줍니다 따라서 이것은 약 95%이고요 P가 표본평균에서 0.10 이내에 있을 확률을 구하는데 P가 표본평균에서 0.10 이내에 있을 확률을 구하는데 여기서 구한 표본평균은 얼마였죠? 0.43이었습니다 0.43에서 0.1 이내면 0.43±0.1이니까 이 확률도 95%임을 신뢰할 수 있습니다 확실히 했으면 하는 것은 이 위부터 밑까지 괄호 안에 있는 것을 다르게 말한 것뿐입니다 괄호 안에 있는 것을 다르게 말한 것뿐입니다 정확한 표준분포의 표준편차에서 그 추정치로 내려오면서 정확한 표준분포의 표준편차에서 그 추정치로 내려오면서 더 느슨한 정의가 되었지만요 그래서 여기에 휘어진 등호를 써서 이것이 근사치임을 나타내었고 정도를 줄이기도 했습니다 하지만 이제 구간을 구했습니다 95%의 확률로 P가 0.43±0.1임을 신뢰할 수 있는 구간이죠 95%의 확률로 P가 0.43±0.1임을 신뢰할 수 있는 구간이죠 95%의 확률로 P가 0.43±0.1임을 신뢰할 수 있는 구간이죠 신뢰 구간입니다 95% 신뢰구간은 0.43 - 0.1은 0.33이니까 백분율로 나타내면 33%이고 0.1을 더하면 0.43 +0.1은 53%니까 95% 신뢰구간은 33%에서 55%입니다 어떤 비율의 확률이 정확히 95%라고 하는 것이 아니라 어떤 비율의 확률이 정확히 95%라고 하는 것이 아니라 실제 비율이 33%에서 55% 사이임을 95% 신뢰할 수 있다고 하는 것이죠 P가 이 범위 안에 있다고요 설문 조사에서 자주 말하는 방식은 설문 조사 결과 43%가 B 후보에게 투표하고 43%가 B 후보에게 투표하고 43%가 B 후보에게 투표하고 다른 사람들은 다 A 후보에게 투표했으니까 57%는 A 후보에게 투표할 것이라고 한 후에 오차한계를 설명하는 것입니다 TV에 나오는 모든 설문 조사에는 모두 오차한계가 나와 있을 것입니다 TV에 나오는 모든 설문 조사에는 모두 오차한계가 나와 있을 것입니다 오차한계는 단지 신뢰구간을 다르게 말한 것 뿐입니다 오차한계는 단지 신뢰구간을 다르게 말한 것 뿐입니다 이 경우 오차한계는 10%이고 이는 95% 신뢰구간이 밑줄 친 값의 ±10%라는 뜻입니다 이는 95% 신뢰구간이 밑줄 친 값의 ±10% 라는 뜻입니다 이는 95% 신뢰구간이 밑줄 친 값의 ±10%라는 뜻입니다 그리고 정말 강조할 점은 실제 결과가 10%이내일 확률이 95%라고 확신할 수는 없다는 것입니다 표본평균의 표준편차를 추정했기 때문이죠 표본평균의 표준편차를 추정했기 때문이죠 하지만 이것은 주어진 정보에서 가장 가까운 추정입니다 100명을 설문 조사했을 때 가장 좋은 신뢰구간은 이것입니다 이 수는 실제로 꽤 큽니다 이 결과를 보면 95%의 확률로 이 값의 실제 값은 33%에서 53%입니다 따라서 B 후보는 아직 이길 확률이 있습니다 100명의 43%만 투표하겠다고 했지만요 100명의 43%만 투표하겠다고 했지만요 이것을 조금 더 정확하게 하려면 더 큰 표본을 구하면 됩니다 당연하죠 표본 100개 대신 그러니까 n이 100 대신 n이 100이면 이 수를 √100 대신 √1000으로 나누니까 이 수를 √100 대신 √1000으로 나누니까 33정도로 나누게 되겠죠 그러면 표본분포의 표준편차의 크기가 줄어들 것입니다 그러면 표본분포의 표준편차의 크기가 줄어들 것입니다 그러면 표준편차 두 배의 거리는 작아지고 작은 오차한계를 가지게 됩니다 작은 오차한계를 가지게 됩니다 그렇게 되면 오차한계를 충분히 작게 해서 정확히 누가 선거를 이길지 구할 수도 있을 것입니다 정확히 누가 선거를 이길지 구할 수도 있을 것입니다