If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:10:28

동영상 대본

제가 제약회사라고 합시다 당뇨병 환자들에게 도움을 줄 것이라고 예상되는 약을 개발했는데 이 약이 특히 헤모글로빈 A1c 수치를 감소시킬 것이라고 생각합니다 헤모글로빈 A1c가 무엇인지 잘 모르시는 분들은 헤모글로빈 A1c가 무엇인지 잘 모르시는 분들은 칸아카데미에서 관련 동영상을 보시기 바랍니다 대략적으로 설명하자면 혈당 수치가 약 3개월의 기간 동안 높다면 그러니까 평균 혈당 수치가 높다면 헤모글로빈 A1c 수치가 높을 것입니다 그리고 약 3개월 동안의 평균 혈당 수치가 낮다면 그리고 약 3개월 동안의 평균 혈당 수치가 낮다면 헤모글로빈 A1c 수치가 낮을 것입니다 그러므로 약을 먹었을 경우에 A1c 수치가 낮아질 가능성이 우연하게 그러는 경우나 다른 변수가 작용했을 때 보다 크다면 이는 신약이 사람들의 당뇨병 조절에 효과적일 수 있음을 의미합니다 이 상황에서, 이를 검증하기 위한 실험을 설계할 때 이 약을 먹는지의 여부를 설명변수라고 할 것입니다 설명변수라고 할 것입니다 그리고 이것에 반응하길 기대하는 것 이 상황에서는 A1c 수치가 혈당 수치 조절에 도움을 주는지에 대한 지표가 되는데 이를 응답변수라고 부릅니다 이것이 바로 응답변수입니다 그러면 실제로 이 실험을 어떻게 설계해야 할까요? 어떤 그룹이 있다고 합시다 당뇨병을 조절해야 하는 사람들 100명으로 이루어진 그룹이 있다고 합시다 100명으로 이루어진 그룹이 있다고 합시다 그리고 이 중 절반을 실험군에 넣고 나머지 반을 대조군에 넣은 후 실험군, 즉 진짜 약을 받는 사람들의 A1c 수치가 유의미하게 개선되어서 이것이 우연하게 일어난 일이 아님을 보여줄 수 있는지 확인합니다 그러면 해 봅시다 대조군이 있을 것이고 이것이 대조군입니다 그리고 이것이 실험군입니다 여러분이 실험군에게만 약을 주고 대조군에게는 약을 주지 않겠다고 할 수도 있지만 그렇게 하면 심리적인 요인이 작용할 수도 있습니다 약효가 그냥 사람들이 이 약이 자신의 당뇨병을 조절할 수 있다고 기대하는 것으로부터 나올 수도 있습니다 이것이 심리적인 어떤 방식으로 그들의 혈당에 영향을 미칠 수 있습니다 더 건강하게 행동하도록 만들 수도 있고 더 건강하지 않게 행동하도록 만들 수도 있습니다 내 당뇨병을 조절할 약이 있으니 단 것을 더 많이 먹어도 괜찮을 것이라고 생각할 수도 있기 때문입니다 그래서 이런 현상을 피하기 위해 어떤 사람이 약을 복용하고 있다는 생각만으로 인해 평소와 다른 방식으로 행동하거나 심리적으로 신체에 영향이 갈 수 있기 때문에 양쪽 그룹 모두에게 약을 줍니다 그리고 양쪽 그룹의 그 누구도 무슨 약을 받았는지 모르게 할 것입니다 그러니까 이 그룹에게는 의약을 주고 이 그룹은 진짜 약을 받게 될 것입니다 하지만 그 두 약은 똑같이 생겨야 하고 사람들은 자신이 어느 그룹에 속해 있는지 몰라야 합니다 이를 맹검법이라고 부릅니다 이중맹검법에 대해서도 들어보셨을 수 있습니다 이는 실험 참여자들만 자신이 어느 그룹에 속하는지 모르는 것이 아니라 의사나 실험 진행자조차도 자신이 어느 것을 주고 있는지 모르는 경우입니다 의약을 주고 있는지, 아니면 진짜 약을 주고 있는지 모릅니다 의약을 주고 있는지, 아니면 진짜 약을 주고 있는지 모릅니다 그렇게 하고 싶다고 합시다 이중맹검법을 사용해서 약을 주는 사람조차도 어느 약을 주고 있는지 모릅니다 이것이 왜 중요하냐고 물을 수도 있습니다 의사가 알거나, 환자와 접촉해서 약을 주는 사람이 알고 있다면 어떤 약인지를 은연중에 알려줄 수도 있습니다 의약일 경우에는 약 복용의 중요성을 그리 강조하지 않는다던가 실수로 어떤 정보를 흘릴 수도 있습니다 이를 막기 위해 이중맹검법을 진행할 수 있습니다 심지어 삼중맹검법도 있는데 결과를 분석하는 사람조차도 어떤 그룹이 대조군이고 결과를 분석하는 사람조차도 어떤 그룹이 대조군이고 어떤 그룹이 실험군인지 모르는 것입니다 이것도 편향을 막기 위한 방법입니다 이제 어떻게 할지 알았으니 실험군과 대조군이 있으니 A1c를 응답변수로 사용할 것입니다 사람들이 의약이나 진짜 약을 먹기 전의 헤모글로빈 A1c 수치를 측정하고 한 3개월 뒤 그들의 A1c 수치를 잴 것입니다 하지만 다음 질문은 100명을 어떻게 이 두 그룹으로 나눌 것인가 하는 것인데 하지만 다음 질문은 100명을 어떻게 이 두 그룹으로 나눌 것인가 하는 것인데 아마 이를 임의로 하고 싶다고 말할 것입니다 맞습니다 임의로 나누지 않았다면 만약에 한쪽에 남자를 몰아넣고 반대쪽에 여자만 다 넣었다면 만약에 한쪽에 남자를 몰아넣고 반대쪽에 여자만 다 넣었다면 남녀의 행동 차이가 여기에서 나타나는 A1c 수치의 차이, 혹은 차이 없음의 원인이 될 수 있습니다 특정 나이대의 사람들이 많거나 특정 지역 사람들, 혹은 특정 식습관을 가진 사람들이 많은 것을 원하지 않으므로 혼재변수의 불균형이 생기는 것을 피하기 위해 임의 추출을 하고 싶을 것입니다 임의 추출 방법들은 이미 이전 동영상들에서 많이 배웠습니다 사람들을 임의로 추출해서 두 그룹으로 나눌 것입니다 이것을 하는 매우 간단한 방법으로는 모든 사람에게 1부터 100까지의 숫자를 배정해 주고 난수발생기를 이용해 나누는 것입니다 혹은 난수발생기를 이용해 대조군에 넣을 50명을 뽑거나 실험군에 넣을 50명을 뽑은 후 나머지는 다른 그룹에 넣으면 됩니다 임의의 표본을 사용했을 때 우연하게 비율이 맞지 않는 것을 방지하기 위해 예를 들어 한쪽에 남자가 훨씬 많거나 다른 쪽에 여자가 훨씬 많은 것을 방지하기 위해 다른 동영상에서 본 층화추출의 한 종류를 사용할 수 있습니다 다른 동영상에서 본 층화추출의 한 종류를 사용할 수 있습니다 임의의 배정을 위한 구획 설계라는 것을 합니다 예를 들어 사람들을 모두 남녀로 나눕니다 50 대 50일 수도 있고 여기서는 우연히 여자 60명에 남자 40명이 있다고 합시다 이제 할 일은 여자 중 30명을 임의로 대조군에 넣고 이제 할 일은 여자 중 30명을 임의로 대조군에 넣고 나머지 30명을 실험군에 넣습니다 그리고 남자 중 20명을 임의로 대조군에 넣고 나머지 20명을 실험군에 넣습니다 이렇게 하면 어떤 사람의 성별이 여기에 편향을 유발할 가능성이 낮아집니다 이렇게 하는 것을 구획 설계라고 부릅니다 층화추출의 한 종류입니다 그리고 여러분이 여기에 절대 우연히 나타나지 않게 만들고 싶은 다른 혼재변수들도 있을 수 있습니다 임의로 배정하는 방법은 여러 가지가 있습니다 이렇게 하고 나서 A1c의 변화를 봅니다 만약 A1c 변화를 보았는데 두 그룹의 A1c 수치 사이에 차이가 없다면 두 그룹의 A1c 수치 사이에 차이가 없다면 약이 아무런 효과가 없을 가능성이 높습니다 여기도 확률이 작용합니다 작은 확률이지만, 그냥 여러분이 운이 없었던 것일 수도 있습니다 작은 확률이지만, 그냥 여러분이 운이 없었던 것일 수도 있습니다 그래서 충분히 많은 사람들로 실험해야 합니다 통계에 대한 이해를 넓혀 감에 따라 어떤 임계값이 되어야 확률이 충분히 낮거나 높아서 결과를 신뢰할 수 있는지 더 잘 이해할 수 있게 될 것입니다 이번에는 발전이 있는 경우를 생각해봅시다 이 발전이 우연하게 일어났을 가능성이 있는지 이 발전이 우연하게 일어났을 가능성이 있는지 혹은 우연하게 일어났을 가능성이 희박한지를 생각해보고 혹은 우연하게 일어났을 가능성이 희박한지를 생각해보고 후자의 경우라면 약효가 있다고 믿을 수 있을 것입니다 후자의 경우라면 약효가 있다고 믿을 수 있을 것입니다 그리고 이 결과를 발표했을 때 다른 사람들도 약을 신뢰할 것입니다 그리고 이 결과를 발표했을 때 다른 사람들도 약을 신뢰할 것입니다 이 상황에서도 과학은 아직 끝나지 않았습니다 아무도 여러분의 약이 좋다고 100% 확신하지는 않을 것입니다 아무도 여러분의 약이 좋다고 100% 확신하지는 않을 것입니다 실험에서 제대로 조절하지 못한 혼재변수가 있을 수 있습니다 실험에서 제대로 조절하지 못한 혼재변수가 있을 수 있습니다 이렇게 구획 설계를 했을 때도 우연히 한쪽 그룹에 나이 든 사람이 지나치게 많다던지 우연히 한쪽 그룹에 나이 든 사람이 지나치게 많다던지 혹은 한쪽 그룹에 특정 지역 출신이 몰렸을 수도 있습니다 그러므로 항상 생각해볼 점들이 남아있습니다 가장 중요하게 고려할 점은 이 실험을 아무리 잘 설계했어도 가장 중요하게 고려할 점은 이 실험을 아무리 잘 설계했어도 어떤 우연에 의해 임의로 나누었음에도 불구하고 좋은 결과를 얻는 긍정 오류가 생기거나 안 좋은 결과를 얻는 부정 오류가 생길 수 있습니다 그러므로 실험에서 매우 중요한 것은 이것은 과학 전반에 적용되는데 내용을 잘 문서화해 놓아서 다른 사람들이 이 실험을 재현할 수 있고 다른 사람들이 이 실험을 재현할 수 있고 일관된 결과를 얻을 수 있어야 합니다 결과뿐만 아니라 실험 설계도 기록해서 다른 사람들이 재현할 수 있는 실험이어야 하며 이를 통해 여러분의 결과가 참이라는 주장에 힘을 실어줄 수 있습니다 이를 통해 여러분의 결과가 참이라는 주장에 힘을 실어줄 수 있습니다 우연한 결과도 아니고 원래의 실험을 잘못 진행해서 얻은 결과도 아니라고 말입니다