주요 내용
현재 시간:0:00전체 재생 길이:17:37

동영상 대본

독감예방에 도움이 된다고 하는 약초가 있습니다 독감예방에 도움이 된다고 하는 약초가 있습니다 이를 확인하기 위해 독감 시즌이 될 때까지 기다렸다가 임의추출한 사람을 세 집단으로 나누었습니다 독감 시즌 내내 1번 집단은 1번 약초를 2번 집단은 2번 약초를 3번 집단은 플라시보를 처방받았습니다 플라시보는 환자나 참가자에게 플라시보는 환자나 참가자에게 효과가 없는 것을 효과가 있다고 하고 주는 것입니다 효과가 없는 것을 효과가 있다고 하고 주는 것입니다 설탕으로 만든 알약처럼 약같아 보이도록 말이죠 이런 수고를 하는 이유는 플라시보 효과는 실제로 효과가 있기 때문입니다 어떤 것이 효과가 있다고 말하는 것만으로 증상이 나아지는 효과입니다 증상이 나아지는 효과입니다 여기 플라시보는 설탕 알약을 받았다고 할게요 독감에 걸리는 것에 영향이 없도록 아주 작은 양으로요 독감에 걸리는 것에 영향이 없도록 아주 작은 양으로요 이런 표는 분할표라고 하는데 이런 표는 분할표라고 하는데 이런 표는 분할표라고 하는데 각 집단에서 독감에 걸린 사람과 걸리지 않은 사람의 수를 나타냅니다 각 집단에서 독감에 걸린 사람과 걸리지 않은 사람의 수를 나타냅니다 주어진 것을 기반으로 합계를 계산해 볼게요 1번 집단에는 120명이 2번 집단에 30 + 100은 140명이고 설탕 알약을 받은 플라시보 집단에는 120명이 있습니다 독감에 걸린 사람의 합계도 표에 추가해 보죠 20 + 30 은 50이고 30을 더하면 80입니다 여기가 열 합계가 됩니다 독감에 걸리지 않은 사람의 합계는 100 + 110은 210이고 90을 더하면 300입니다 그리고 모든 사람의 합은 380이고요 이 열과 행의 합계는 모두 380이어야 합니다 그러면 이제 분할표에 주어진 정보와 그러면 이제 분할표에 주어진 정보와 카이제곱분포에 대한 지식을 가지고 어떤 결론을 내릴 수 있는지 생각해 봅시다 귀무가설을 만들어 보죠 귀무가설은 약초에 작용이 없다고 하는 것입니다 귀무가설은 약초에 작용이 없다고 하는 것입니다 귀무가설은 약초에 작용이 없다고 하는 것입니다 귀무가설은 약초에 작용이 없다고 하는 것입니다 귀무가설은 약초에 작용이 없다고 하는 것입니다 그리고 대립가설은 약초에 작용이 있다고 하는 것입니다 약초에 작용이 있다고 하는 것입니다 보시면 좋은 작용을 하는지는 상관 없습니다 단지 작용이 있는 것이죠 독감에 걸릴 확률을 높일 수도 있습니다 실제로 좋은 작용을 하는지 확인하는 것이 아니고 아무것도 하지 않는 것과는 다른지만 묻는 것입니다 가설검정 할 때 항상 그랬던 것처럼 귀무가설을 가정해 봅시다 귀무가설을 가정하고 그 가정 속에서 이런 자료 이상의 극값을 얻는 확률이 아주 낮은지 알아봅시다 그리고 아주 낮다면 귀무가설을 기각합니다 다른 가설검정에서처럼 여기에도 유의수준이 필요합니다 어떤 이유에서건 이 문제에서 유의수준은 10%, 0.10이라고 하죠 이 문제에서 지켜야 할 유의수준입니다 그러면 이제 이 분할표에 대한 카이제곱 통계량을 계산해야 합니다 그러면 이제 이 분할표에 대한 카이제곱 통계량을 계산해야 합니다 식당 문제와 아주 비슷합니다 식당 문제와 아주 비슷합니다 귀무가설을 가정하고 각 셀의 기댓값을 찾습니다 각 셀의 기댓값을 찾습니다 각 항목이 셀이고요 각 항목이 셀이고요 엑셀에서 표의 각 항목을 셀이라고 하는 것처럼요 엑셀에서 표의 각 항목을 셀이라고 하는 것처럼요 귀무가설을 가정했을 때의 기댓값을 찾고 나면 귀무가설을 가정했을 때의 기댓값을 찾고 나면 그 기댓값에서 거리의 제곱을 구하고 그 기댓값에서 거리의 제곱을 구하고 기댓값으로 정규화 합니다 그 차의 합을 구하고 이 차의 제곱이 아주 크면 그런 값을 얻는 확률은 아주 작을 것이고 귀무가설을 기각할 수 있을 것입니다 그러면 어떻게 기댓값을 얻는지 알아보죠 약초에 작용이 없다고 가정하고요 약초가 아무 작용을 하지 않는다면 이 모집단 전체에 아무 일도 없었어야 합니다 약초에 작용이 없으니까요 이 모집단 표본을 사용해 모집단이 아니죠 이 표본을 사용해 독감에 걸릴 사람과 안 걸릴 사람의 기댓값을 찾아 봅시다 오른쪽을 보면 380명 중 80명이 독감에 걸리지 않았습니다 방금 모집단이라 했는데 이 말은 전세계 모든 사람들을 표집한게 아니니까 하면 안됩니다 전세계 모든 사람들을 표집한게 아니니까 하면 안됩니다 이건 표본이죠 헷갈리지 마세요 헷갈리지 마세요 헷갈리지 마세요 어쨋든 표본에서 자료의 전체를 사용하는데 자료에 차이가 없다고 가정하기 때문입니다 하는 김에 전체 자료를 이용해 독감에 걸리고 안 걸리는 빈도수의 기댓값을 찾는 것입니다 독감에 걸리고 안 걸리는 빈도수의 기댓값을 찾는 것입니다 80 /380은 독감에 걸리지 않았고요 21%네요 21%는 독감에 걸리지 않았습니다 여기 써보죠 이는 전체의 21%이고 1에서 21을 빼면 여기는 79%네요 300/ 380를 계산해도 79%가 나옵니다 전체 표본에 기반해보면 전체의 21%가 독감에 걸리고 전체의 21%가 독감에 걸리고 79%는 독감에 걸리지 않아야 합니다 각 집단을 살펴보죠 120명 중 21%가 독감에 걸려야 한다고 하면 여기에 오는 기댓값은 얼마일까요? 120에 21%를 곱해 볼게요 120에 21%를 곱해 볼게요 반올림해서 25.3명이 독감에 걸렸어야 합니다 반올림해서 25.3명이 독감에 걸렸어야 합니다 기댓값은 노란색으로 써 볼게요 기댓값은 한 집단에서 21%가 독감에 걸렸어야 한다고 하면 1번 집단에서는 25.3명이 독감에 걸려야 합니다 1번 집단에서는 25.3명이 독감에 걸려야 합니다 나머지는 독감에 걸리지 않으니까 값을 빼거나 120에 79%를 곱해보면 됩니다 120 - 25.3은 94.7이네요 94.7명이 아프지 않았어야 합니다 이것도 기댓값이고요 이것도 기댓값이고요 94.7명이 독감에 걸리지 않았습니다 다른 집단도 계산해 보죠 2번 집단도 21%가 독감에 걸려야 하는데요 2번 집단도 21%가 독감에 걸려야 하는데요 집단의 전체인 140명의 21%는 29.4명입니다 그리고 나머지 140 -29.4는 독감에 걸리지 않아야 합니다 정리하면 약초에 작용이 없을 때 29.4명은 독감에 걸리고 여기에 독감에 걸리지 않은 사람이 110.6명입니다 이건 꽤 비슷하네요 숫자만 놓고 보면 전체에 비해서 이 약초는 작용이 별로 없는것 같습니다 전체에 비해서 이 약초는 작용이 별로 없는것 같습니다 그리고 플라시보 집단을 살펴 봅시다 그리고 플라시보 집단을 살펴 봅시다 그리고 플라시보 집단을 살펴 봅시다 21%가 독감에 걸려야 하니까 120의 21%는 25.2명입니다 여기에요 사실 여기는 반올림하면 첫 번째와 같아야 합니다 이것이 21%라고 썼지만 사실 소수점 자리까지 있었고 이 두 집단의 크기가 같으니까 독감에 걸린 비율도 같아야죠 25.3이라고 하겠습니다 지금 25.2가 나온 이유는 여기 있었을 소수점을 계산하지 않았기 때문입니다 여기에서는 계산한 것이니까 이렇게 하겠습니다 이 집단에서 여기 독감에 걸리지 않은 사람은 94.7명이고요 이 자료만 가지고 보면 2번 약초는 어떤 면에서 훨씬 나쁘게 작용하네요 아닙니다 수가 작았어야 하는데 그건 아니니까 나쁘게 작용한게 아니네요 나쁘게 작용한게 아니네요 어쨋든 이 숫자만으로 판단하면 안됩니다 어쨋든 이 숫자만으로 판단하면 안됩니다 카이제곱 통계량을 계산해 봅시다 카이제곱 통계량을 계산해 봅시다 카이제곱 통계량을 계산해 봅시다 재미로 이렇게 써 볼까요? 아니면 대문자 X를 쓸까요? 이 확률변수분포는 카이제곱분포의 근사치이니까요 그렇게 하죠 조금 있다가 자유도에 대해 이야기해 보겠습니다 χ로 바꿀게요 이렇게 쓰는 사람도 있습니다 이렇게 쓰는 사람도 있습니다 여기 카이제곱 통계량을 구할 때는 변량과 기댓값 사이 거리를 제곱하면 됩니다 변량과 기댓값 사이 거리를 제곱하면 됩니다 그리고 기댓값으로 나눠 주고요 그러면 (20 - 25.3)² / 25.3 + (30 - 29.4)² / 29.4 +(30 - 25.3)² / 25.3입니다 +(30 - 25.3)² / 25.3입니다 이 줄도 해야 하니까 밑에서 계속 할게요 H₁은 무시하고요 그럼 + (100 - 94.7)² / 94.7 패턴이 보이네요 + (110 - 110.6)² / 110.6 마지막으로 + (90 - 94.7)² / 94.7 마지막으로 + (90 - 94.7)² / 94.7 마지막으로 + (90 - 94.7)² / 94.7입니다 계산기로 계산해 볼게요 계산기로 계산해 볼게요 조금 걸리겠네요 계산기에선 괄호를 써야 합니다 (20 - 25.3)² / 25.3 + (30 - 29.4)² / 29.4 + (30 - 25.3)² / 25.3 + (30 - 29.4)² / 29.4 + (30 - 25.3)²/ 25.3 반 끝났고 +(100 - 94.7)² / 94.7 +(100 - 94.7)² / 94.7 +(110- 암산해도 되지만 다 적어 볼게요 (110 - 110.6)² / 110.6 마지막으로 오타가 없다는 가정 하에 (90 - 94.7)² / 94.7입니다 얼마인지 볼까요? 2.528정도니까 2.53이라고 하죠 카이제곱분포는 카이제곱분포는 귀무가설이 맞다는 가정 하에 2.53입니다 이제 이 카이제곱 통계량의 자유도를 구해야 합니다 이제 이 카이제곱 통계량의 자유도를 구해야 합니다 이제 이 카이제곱 통계량의 자유도를 구해야 합니다 규칙을 하나 알려드리고 이 규칙이 왜 이런 분할표에 적용되는지 설명드리죠 자유도에 대해서는 나중에 더 깊게 이야기해 보겠습니다 분할표에 적용되는 이 규칙은 먼저 행의 개수와 열의 개수를 세는 것입니다 여기에는 행 2개와 열 3개가 있네요 합계는 세지 않습니다 그래서 열이 세 개입니다 그러면 분할표의 자유도는 그러면 분할표의 자유도는 행의 개수 -1 x 열의 개수 -1입니다 행의 개수 -1 x 열의 개수 -1입니다 이 경우 행 2개와 열 3개니까 2 - 1 x 3 -1입니다 2 - 1 x 3 -1입니다 1 x 2는 2니까 자유도는 2입니다 왜 이게 말이 되는지 왜 이게 말이 되는지 나중에 더 알아보겠지만 합계를 안다고 가정했을 때 합계를 안다고 가정했을 때 그러니까 여기 이 모든 정보를 가지고 있을 때 그러니까 여기 이 모든 정보를 가지고 있을 때 사실 모수를 알고 있을 때인데 어쨋든 합계를 알고 이 정보도 가지고 있으면 그러니까 행에서 r-1개의 정보가 있으면 마지막은 합계에서 빼서 알 수 있습니다 마지막은 합계에서 빼서 알 수 있습니다 예를 들어 여기서 이것을 알면 밑에 이건 쉽게 찾을 수 있습니다 새 정보가 아니라 합계에서 20을 뺀 것이죠 똑같이 이것을 알면 이것은 새로운 정보가 아닙니다 그리고 이 둘을 알면 이것이 새로운 정보가 아닙니다 항상 다른 것과 합계를 가지고 계산해 낼 수 있죠 이게 자유도가 열 - 1 x 행 -1인 이유 중 하나입니다 어쨋든 이 경우 카이제곱 통계량은 자유도가 2입니다 여기 위에 있는 ⍺의 값 여기 위에 있는 ⍺의 값 곧 정해놓은 유의수준은 10%였습니다 여기 다시 써 보죠 ⍺ = 10%입니다 이제 ⍺가 10%인 임계점의 카이제곱 통계량을 찾아볼 겁니다 이제 ⍺가 10%인 임계점의 카이제곱 통계량을 찾아볼 겁니다 이제 ⍺가 10%인 임계점의 카이제곱 통계량을 찾아볼 겁니다 이것이 그것보다 더 극값이라면 그러니까 이 값을 얻을 확률이 임계점의 통계량을 얻는 확률 10%보다 낮다면 귀무가설을 기각하고 더 극값이 아니라면 귀무가설을 기각하지 않을 것입니다 이제 자유도가 2인 카이제곱분포에서 이제 자유도가 2인 카이제곱분포에서 임계점의 카이제곱 통계량을 찾아봅시다 잠깐 뒤로 가서 자유도가 2이고 자유도가 2이고 유의수준은 10%이니까 임계점의 카이제곱값은 4.60입니다 다른 방법으로 생각해 보면 자유도가 2인 카이제곱분포를 보았을 때 이 파란색이고요 임계값 4.60을 찾습니다 임계값 4.60을 찾습니다 4.60이면 5가 여기이니까 4.60은 이쯤에 있겠네요 여기 있는 임계값 4.60에서 적어도 그만큼 극값을 얻는 확률은 10%입니다 적어도 그만큼 극값을 얻는 확률은 10%입니다 여기가 중요한 부분이죠 아까까지 계산한 카이제곱 통계량이 이 기각역에 들어간다면 귀무가설을 기각할 것입니다 하지만 구한 카이제곱 통계량은 2.53입니다 2.53밖에 되지 않습니다 이쯤에 있죠 귀무가설을 가정했을 때 얻는 것은 크게 이상한 값은 아닙니다 귀무가설을 가정했을 때 얻는 것은 크게 이상한 값은 아닙니다 따라서 지금 가진 자료로는 귀무가설을 기각할 수 없습니다 정확히 약초에 작용이 없다고는 할 수 없지만 이것을 기반으로는 작용이 있다고 할 수 없기 때문에 기각하지 않을 것입니다 100% 사실인지는 모르지만 기각할 수는 없습니다 이런 관점에서는 약초가 다른 것과 다르다고 믿게 할 수 있는 결과가 나오지 않았습니다 결과가 나오지 않았습니다 그리고 이 중 하나는 플라시보였으니까 플라시보와도 다르지 않았습니다