If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:15:02

동영상 대본

인구가 100억 명인 나라에서 대선이 다가오고 있습니다 대선에는 후보가 두 명이 있는데 대선에는 후보가 두 명이 있는데 A 후보와 B 후보입니다 그리고 어떤 현실 속에서는 모든 사람들이 아주 결단력 있고 투표에 참여하며 모든 사람들이 아주 결단력 있고 투표에 참여하며 A 후보나 B 후보 중에 한 명을 꼭 뽑을 겁니다 그러면 그 현실에서는 1 - p 퍼센트가 p를 먼저 할게요 p퍼센트가 B에게 투표합니다 순서는 상관없어요 p퍼센트는 B에게 투표하고 나머지는 A에게 투표합니다 1-p퍼센트가 A에게 투표하는 것이죠 이미 이것이 베르누이분포라는 것을 알아챘을 수도 있겠네요 이미 이것이 베르누이분포라는 것을 알아챘을 수도 있겠네요 표본에서 얻을 수 있는 값이 둘 중 하나이죠 여기서 얻을 수 있는 값은 A 후보에게 투표하거나 B 후보에게 투표하는 것인데 그런 값은 처리하기 어렵죠 A와 B의 평균을 구할 순 없어요 문자이지 숫자가 아니니까요 그래서 수학적으로 다루기 쉽게 하기 위해 A에게 투표하는 사람을 표집하는 건 0을 표집하는 것과 같다고 하고 B에게 투표하는 사람을 표집하는 건 1을 표집하는 것과 같다고 할 겁니다 B에게 투표하는 사람을 표집하는 건 1을 표집하는 것과 같다고 할 겁니다 베르누이분포를 가지고 그렇게 하면 베르누이분포 동영상에서 배웠듯이 이 분포의 평균은 p와 같습니다 그 증명도 아주 간단하고요 그 증명도 아주 간단하고요 어쨋든 분포의 평균은 이 분포가 가질 수 있는 값이 아니라 여기 이쯤 어딘가에 있고 p와 같습니다 이 나라의 인구는 100억 명입니다 실질적으로 절대 100억 명에게 누구를 뽑을지 물어볼 수는 없어요 누구를 뽑을지 물어볼 수는 없어요 따라서 정확히 이것의 모수가 무엇인지는 알 수 없죠 따라서 정확히 이것의 모수가 무엇인지는 알 수 없죠 평균, p를 알 수 없는 겁니다 그 대신 임의의 설문조사를 실시할 겁니다 그 대신 임의의 설문조사를 실시할 겁니다 모집단에서 표본을 구해 그 자료를 살펴보고 p가 무엇인지 추정해 보겠습니다 진짜 필요한 것은 p이니까요 진짜 필요한 것은 p이니까요 그래서 p를 표본으로 추정하고 그 추정치가 얼마나 좋은 것인지 생각해 볼게요 그 추정치가 얼마나 좋은 것인지 생각해 볼게요 그러면 100명을 표본을 임의추출했다고 합시다 그래서 다음의 결과를 얻었습니다 A 후보에게 투표하겠다고 한 사람은 57명이었습니다 A 후보에게 투표하겠다고 한 사람은 57명이었습니다 A 후보에게 투표하겠다고 한 사람은 57명이었습니다 A 후보에게 투표하겠다고 한 사람은 57명이었습니다 0인 표본이 57개인 것이고요 그리고 나머지는 말했듯이 모두 결단력이 좋아서 결정 못한 사람 없이 나머지 43명은 B 후보에게 투표하겠다고 했습니다 이건 1을 43개 표집하는 것과 같습니다 그럼 주어진 표본의 표본평균과 표본분산은 얼마일까요? 그럼 주어진 표본의 표본평균과 표본분산은 얼마일까요? 표본평균은 단지 0과 1의 평균입니다 0은 57개이니까 57・0 + 1이 43개면 표본의 합이죠 43 ・1입니다 그리고 표본 전체의 개수로 나눠 줍니다 /100이죠 계산하면요? 57・ 0은 0이고요 43・1 /100은 0.43입니다 이것이 표본평균이고, 평균은 단지 얻은 측정점 100개의 평균입니다 이것이 표본평균이고, 평균은 단지 얻은 측정점 100개의 평균입니다 그러면 표본분산은 얼마일까요? 그러면 표본분산은 얼마일까요? 표본분산은 평균까지의 거리 합을 표본 개수 - 1 로 나누면 됩니다 이건 표본분산이고 이 분포 실제 분산의 가장 좋은 추정치를 얻으려고 하기 때문이죠 그래서 100으로 나누는 것이 아니라 100-1로 나누는 것입니다 훨씬 전 동영상에서 배웠었어요 0인 표본은 57개가 있고요 0인 표본은 57개가 있고요 같은 노란색으로 할게요 0인 표본 57개입니다 각 표본은 평균에서 0 - 0.43만큼 떨어져 있어요 각 표본은 평균에서 0 - 0.43만큼 떨어져 있어요 각 표본은 0이고 0.43을 뺍니다 0과 0.43의 차이죠 거리의 제곱을 구하는 것이니까 제곱해 줍니다 분산 구할 땐 이렇게 해요 이런건 57개이고요 그 다음 표본 모집단에서 1인 표본은 43개이니까 1은 43개이고 1은 평균에서 1 - 0.43만큼 평균으로부터 떨어져 있어요 거리를 제곱하고요 n으로 나누는 것이 아닙니다 100으로 나누면 안되죠 실제 모평균의 추정치를 구하고 있으니까요 이게 가장 좋은 추정치가 되게 하려면 왜 그런지는 옛날에 설명해 드렸고 100 -1을 해서 99로 나눠야 합니다 그럼 계산기로 표본분산을 계산해 보죠 그럼 계산기로 표본분산을 계산해 볼게요 그럼 계산기로 표본분산을 계산해 볼게요 분자 먼저 해서 (57 * (0 - 0.43)² + 43 * (1 - 0.43)²)를 100-1, 그러니까 99로 나누면 0.2475네요 표본분산은 0.2475였습니다 표본표준편차를 구할 때는 여기에 제곱근만 씌우면 됩니다 표폰표준편차는 표본분산에 제곱근만 씌우면 되니까 표폰표준편차는 표본분산에 제곱근만 씌우면 되니까 방금 구한 이 값에 제곱근을 씌우면 0.497이네요 반올림 해서 0.50이라고 할게요 표본표준편차는 0.50입니다 지금 이걸 보면 이게 A와 B후보에게 투표하는 사람 비율의 가장 좋은 추정치라고 생각하겠죠 A와 B후보에게 투표하는 사람 비율의 가장 좋은 추정치라고 생각하겠죠 평균의 가장 좋은 추정치는 43%가 B 후보에게 투표하고 나머지는 A 후보에게 투표한다는 것입니다 하지만 이 표본이 얼마나 좋은 표본인지에 대해 생각해 보아야 합니다 하지만 이 표본이 얼마나 좋은 표본인지에 대해 생각해 보아야 합니다 한 발 더 나아가서 43% 주변에 95%의 확률로 실제 평균이 있다고 신뢰할 수 있는 구간을 찾아 볼게요 실제 평균이 있다고 신뢰할 수 있는 구간을 찾아 볼게요 확실하게 이해하도록 그려보죠 여기서 표본평균은 표본분포의 표본평균에서 표집한 것입니다 그려 볼게요 표본평균의 표본분포이죠 이 경우 이산분포에서 표집했으니까 이산분포가 되겠지만 가능한 값이 100개 있어서 이게 100개의 다른 값을 가질 수 있는 것이에요 0에서 1까지 아무거나요 막대를 100개 그리기는 힘드니까 연속되게 그려 보겠습니다 막대를 100개 그리기는 힘드니까 연속되게 그려 보겠습니다 그렇게 했다면 여기 이렇게 막대가 있었겠죠 표본평균이 1일 확률은 아주 작은 확률이고 그 다음으로 막대가 계속 있을 겁니다 그 다음으로 막대가 계속 있을 겁니다 그건 너무 오래 걸리니까 이 정규곡선으로 어림하겠습니다 이 정규곡선으로 어림하겠습니다 어쨌든 이건 표본평균의 표본분포입니다 어쨌든 이건 표본평균의 표본분포입니다 어쨌든 이건 표본평균의 표본분포입니다 어쨌든 이건 표본평균의 표본분포입니다 어쨌든 이건 표본평균의 표본분포입니다 이쯤에 평균이 있죠 이쯤에 평균이 있죠 평균은 이렇게 표현할 수 있습니다 평균은 이렇게 표현할 수 있습니다 평균은 이렇게 표현할 수 있습니다 하지만 다른 동영상에서도 많이 보았듯이 이 평균은 이 문제에서 각각의 표본 100개를 표집했던 모집단의 평균과 같습니다 각각의 표본 100개를 표집했던 모집단의 평균과 같습니다 그래서 이건 μ랑 같고 그건 p와 같죠 그래서 이건 μ랑 같고 그건 p와 같죠 그래서 이건 μ랑 같고 그건 p와 같죠 이제 이 분포의 분산을 여기에 이렇게 그려 볼게요 분포의 분산 대신 편차라고 하겠습니다 분포의 분산 대신 편차라고 하겠습니다 이 분포의 표준편차는 바로 이 거리고요 정확히는 표본평균 표본분포의 표준편차이고 이는 여러번 보았듯이 여기 이 모집단분포의 표준편차와 같습니다 여기 이 모집단분포의 표준편차와 같습니다 여기 이 모집단분포의 표준편차와 같습니다 그 표준편차는 이 거리이고요 여기 이 분포의 표준편차를 여기 이 분포의 표준편차를 표본크기의 제곱근으로 나눠 줍니다 표본크기의 제곱근으로 나눠 줍니다 그리고 지난 동영상들에서 실질적으로나 직관적으로 왜 그런지 알아보았습니다 √100이죠 그러면 이것을 10으로 나누는 것이네요 이게 얼마인지는 모릅니다 정말로 이게 얼마인지 아는 방법은 실제로 1억명을 설문 조사하는 것이고 그건 불가능할 겁니다 실제로 1억명을 설문 조사하는 것이고 그건 불가능할 겁니다 따라서 밑의 표준편차를 추정할 때 모표준편차에 대한 가장 좋은 추정치로 표본표준편차를 사용합니다 모표준편차에 대한 가장 좋은 추정치로 표본표준편차를 사용합니다 이건 추정치라는 것에 주의하세요 이것의 정확한 수는 표본만을 통해 구할 수 없습니다 이것의 정확한 수는 표본만을 통해 구할 수 없습니다 하지만 추정할 수는 있죠 왼쪽 S가 이 표준편차의 가장 좋은 추정치이고 10으로 나누면 가장 좋은 표본평균 표본분포의 표준편차 추정치를 얻게 됩니다 가장 좋은 표본평균 표본분포의 표준편차 추정치를 얻게 됩니다 이건 어디까지나 추정치라는 걸 기억하시고요 이건 어디까지나 추정치라는 걸 기억하시고요 그래서 지금부터는 그 사실을 감안해야 합니다 그래서 지금부터는 그 사실을 감안해야 합니다 이것은 0.5와 거의 가까운 추정치입니다 이것은 0.5와 거의 가까운 추정치입니다 이것은 0.5와 거의 가까운 추정치입니다 그리고 이 수는 각각 다른 표본마다 달라지죠 그리고 이 수는 각각 다른 표본마다 달라지죠 정해진 수가 아니고요 표본에 종속되는 수입니다 표본에서 얻는 수에 따라 조금씩 달라질 것입니다 표본에서 얻는 수에 따라 조금씩 달라질 것입니다 이 경우는 S인 0.50를 10으로 나누면 이 경우는 S인 0.50를 10으로 나누면 0.05입니다 여기 이 표준편차의 가장 좋은 추정치는 0.05이고 5%라고 볼 수도 있습니다 이제 구한 추정치들을 활용해 표본평균 주변에 95%의 확률로 이제 구한 추정치들을 활용해 표본평균 주변에 95%의 확률로 실제 평균이 표준편차의 두 배 안에 있다고 실제 평균이 표준편차의 두 배 안에 있다고 신뢰할 수 있는 구간을 찾아 볼게요 실제 평균이 그 구간안에 있을 확률이 95%라고 말할 수도 있겠네요 실제 평균이 그 구간안에 있을 확률이 95%라고 말할 수도 있겠네요 적어 볼게요 어떤 신뢰 할 수 있는 구간을 찾는데 따옴표는 표준편차가 0.05인지 정확히는 알지 못하고 따옴표는 표준편차가 0.05인지 정확히는 알지 못하고 따옴표는 표준편차가 0.05인지 정확히는 알지 못하고 추정하고 있기 때문이고요 95% 확률로 모집단의 실제 평균이 있다고 신뢰할 수 있는 구간이죠 95% 확률로 모집단의 실제 평균이 있다고 신뢰할 수 있는 구간이죠 실제 평균은 모집단에서 B 후보에게 투표하는 사람 또는 모집단에서 1의 비율과 같습니다 B 후보에게 투표하는 사람 또는 모집단에서 1의 비율과 같습니다 μ가 p와 같다는 것이지요 μ가 p와 같다는 것이지요 95%의 확률로 실제 p가 있는 구간을 찾습니다 95%의 확률로 실제 p가 있는 구간을 찾습니다 그리고 이 동영상을 시작한지 14분이나 지났으니까 동영상은 여기서 그만하고 여태까지 한 것을 기반으로 스스로 생각해 보세요 여태까지 한 것을 기반으로 스스로 생각해 보세요 화면 위쪽에 표본평균을 구해 놓았고요 화면 위쪽에 표본평균을 구해 놓았고요 그리고 추정치를 구하는데 일단 이건 표본평균이죠 일단 이건 표본평균이죠 표본분포의 실제 평균은 알지 못하고 표본분포의 실제 표준편차도 알지 못합니다 표본분포의 실제 표준편차도 알지 못합니다 표본표준편차로 추정치를 구했죠 표본표준편차로 추정치를 구했죠 그럼 이제 여태까지 구한 것과 신뢰구간에 대해 배운 내용을 바탕으로 어떤 대략적인 구간을 찾는데 표준편차를 추정해서 대략적입니다 95% 확률로 실제 모평균 또는 모집단에서 1의 비율 p가 있는 구간을 어떻게 찾을까요 또는 모집단에서 1의 비율 p가 있는 구간을 어떻게 찾을까요 다음 동영상에서 알아보겠습니다