If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

충분하지 못한 표집의 편향성 예제

충분하지 못한 표집의 편향성 예제.

동영상 대본

한 상원 의원이 자신의 주 사람들이 한 상원 의원이 자신의 주 사람들이 인터넷 사생활 문제에 대해 어떻게 생각하는지 알고 싶어 합니다 이 상원 의원은 전화번호부에서 100명을 임의로 선출해 여론조사를 했습니다 참고로 휴대폰 번호와 비공개 번호는 전화번호부에 없습니다 상원 위원은 자신이 고른 100명에게 모두 응답이 올 때까지 계속 전화를 걸었습니다 여론조사 결과에 따르면 응답자 중 42%가 인터넷 사생활에 대해 "매우 걱정"한다고 답하였습니다 이 시나리오에서 편향된 결과를 유발하는 가장 큰 요인은 무엇일까요? 여기서 추가로 생각해보아야 할 점은 어떤 종류의 편향이 생길 수 있을까요? 응답자의 수가 너무 많게 잡혔을까요 아니면 너무 적게 잡혔을까요? 응답자의 수가 너무 많게 잡혔을까요 아니면 너무 적게 잡혔을까요? 어쩌면 편향이 없을 수도 있습니다 하지만 보기 상에서 편향 없음은 고를 수 없으므로 이 셋 중 하나가 답일 것입니다 여러분이 이 동영상을 일시정지 해놓고 이 문제에 대해 생각해보기를 바랍니다 여러분이 상원 의원이고 응답자, 즉 주민 중 몇 퍼센트가 인터넷 사생활에 대해 매우 걱정하고 있는지 알고 싶어 합니다 그래서 전화번호부에서 100명을 뽑습니다 모두 응답할 때까지 계속 전화를 걸고 42%가 매우 걱정한다는 결과를 얻습니다 여기서 편향의 원인은 무엇일까요? 이제 함께 문제를 풀어 봅시다 무응답 편향은 어떤 경우에 발생하나면 100명을 선택하였고 예를 들어 50명 밖에 응답하지 않았는데 다시 전화를 걸지 않은 경우에 생깁니다 여론조사를 위해 추출한 표본 중에서 50명은 응답조차 하지 않은 것입니다 무응답이 발한 것이죠 응답하지 않은 50명한테 무응답이 발한 것이죠 응답하지 않은 50명한테 여론 조사의 결과를 왜곡할 무언가가 있었을 수도 있고 오히려 그들의 의견도 받았다면 더 좋은 자료를 얻게 되었을지도 모릅니다 하지만 이 경우에는 상임 의원이 고른 100명이 모두 응답할 때까지 전화를 걸었습니다 표본으로 뽑은 100명이 무조건 모두 응답하게 만들었습니다 그러므로 여기서 무응답은 문제가 되지 않습니다 다음 선택지는 미포함 편향입니다 미포함 편향은 모집단 중 특정 부분에서 표본 추출을 할 수 없는 경우 발생합니다 그리고 그 특정 부분은 그곳에서 표본을 추출하지 않았기 때문에 편향을 유발할 수 있습니다 이제 이 경우에는 무슨 일이 발생했는지 봅시다 여러분은 상원 의원입니다 모든 주민을 표본으로 삼고 싶지만 대신에 전화번호부에 수록되어 있는 주민들로부터 표본을 추출합니다 주민들로부터 표본을 추출합니다 이 사람들이 전화번호부에 수록되어 있는 사람들입니다 이 사람들이 전화번호부에 수록되어 있는 사람들입니다 그러므로 유선전화를 가지고 있지만 비공개로 해놓아서 그러므로 유선전화를 가지고 있지만 비공개로 해놓아서 전화번호부에 없는 사람들은 표본추출을 하지 않습니다 그리고 유선전화가 없고 핸드폰만 있는 사람들도 표본추출에 포함되지 않습니다 그리고 유선전화가 없고 핸드폰만 있는 사람들도 표본추출에 포함되지 않습니다 이게 왜 중요한지 물어볼 수도 있습니다 생각해 봅시다 전화번호부에 번호를 비공개로 해놓은 사람들이나 아예 유선전화가 없는 사람들 중 일부는 다른 사람들보다 조금 더 사생활에 대해 관심을 가질 가능성이 높습니다 이 사람들은 명백히 수록되지 않기를 선택했기 때문입니다 그러므로 여기서는 분명히 미포함이 편향을 유발하는 매우 큰 요인이 될 수 있습니다 관심을 갖는 모집단 중 일부에서만 표본 추출을 하고 있는 것입니다 특히, 사생활에 대해 특별히 신경 쓸 만한 사람들을 놓치고 있습니다 그러므로 미포함 때문에 42%는 실제로 인터넷 사생활에 대해 걱정하는 사람들의 수 보다 적은 수치일 가능성이 큽니다 아마 여기 밖에 있는 사람들 중 더 큰 비율이 사생활에 관심을 가질 가능성이 높은데 이들은 번호를 비공개로 했거나 아예 유선전화가 없기 때문입니다 그러므로 미포함이 편향을 유발했을 가능성이 크고 이는 42%라는 수치가 상원 의원의 주민들 중 실제로 인터넷 사생활에 관심을 갖는 사람들의 수보다 적음을 암시합니다 이제 마지막 선택지인 자발적 표본 추출입니다 이것은 어떤 경우인가 하면 여러분이, 혹은 상임 의원이 게시판이나 자신의 웹사이트 등을 통해 투표를 해달라고, 혹은 인터넷 사생활에 대해 얼마나 신경 쓰는지에 대한 정보를 제공해달라고 사람들에게 부탁하는 경우입니다 이 경우에 편향을 유발하는 요인은 누가 그 웹사이트에 접속하느냐의 문제입니다 만약 여러분이 내 웹사이트에 와서 여론조사를 하라고 한다면 만약 여러분이 내 웹사이트에 와서 여론조사를 하라고 한다면 여러분은 모집단 중에서 자원하는 일부의 사람들부터로만 정보를 얻게 됩니다 하지만 이는 이 문제의 상황과는 다르죠 이 상임 위원은 100명에게 자원해달라고 하지 않았습니다 대신 직접 전화번호부에서 100명을 선출했습니다 그러므로 이는 분명하게 미포함 편향이 일어난 상황입니다