주요 내용
현재 시간:0:00전체 재생 길이:10:44

수형도를 이용한 조건부 확률

동영상 대본

회사는 채용 절차의 특정 단계에서 불법 약물 사용에 대해 지원자를 심사합니다 불법 약물 사용에 대해 지원자를 심사합니다 회사가 사용하는 테스트 방법은 2%의 거짓 양성 비율과 1%의 거짓 음성 비율을 가집니다 5%의 지원자들이 불법적인 약물을 복용했다고 가정합시다 그리고 지원자를 임의로 뽑습니다 지원자가 테스트에 양성 반응을 보였을 때 정말 약물을 복용했을 확률은 얼마일까요? 이 문제를 함께 풀어봅시다 먼저 문제에서 말하는 것을 확실하게 정리합시다 회사 지원자들에 대한 약물 테스트가 있고 그 테스트는 2%의 거짓 양성 비율을 가집니다 이가 뜻하는 바가 무엇일까요? 이 문장의 뜻은 사람이 약물을 복용하지 않았을 때 테스트에서 음성이 나와야 하지만 양성이 나올 확률이 2%라는 의미입니다 이게 바로 거짓 양성입니다 음성이 나와야 하지만 양성이 나오게 됩니다 이에 대해 생각하는 다른 방법은 누군가 약물을 사용하지 않은 사람이 이 테스트를 받았을 때 불법 약물을 사용했다고 나올 확률이 2%라는 소리입니다 불법 약물을 사용했다고 나올 확률이 2%라는 소리입니다 문제에서는 1%의 거짓 음성 비율을 가진다고 했습니다 이것은 무슨 뜻일까요? 이 뜻은 누군가 실제로 불법 약물을 복용했다면 테스트는 1%의 확률로 약물을 하지 않았다고 한다는 뜻입니다 테스트는 1%의 확률로 약물을 하지 않았다고 한다는 뜻입니다 거짓되게 음성의 결과를 주는 것이죠 양성 판정을 줘야함에도 불구하고 말입니다 그리고 문제에서 5%의 지원자가 실제로 불법 마약을 사용하고 있다고 합니다 그래서 몇 가지 방법으로 문제에 접근할 수 있습니다 가장 개념화하기 쉬운 방법 중 하나는 많은 지원자를 만들어 보는 것입니다 계산하기 쉬운 숫자로 문제를 풀어 보겠습니다 10,000명의 지원자로 시작한다고 가정합시다 딱 정해진 숫자를 사용하는데 이 숫자를 방금 지어낸 숫자입니다 이것은 1,000이 될 수도 100,000이 될 수도 있습니다 하지만 이 숫자가 계산이 편할 것 같습니다 지원자가 9,785명 일 때 보단 말입니다 이 숫자가 100%의 지원자들을 나타냅니다 여기 문제에서 중요한 정보를 줬습니다 지원자들 중 5%가 실제로 불법 약물을 사용하고 있다는 사실입니다 10,000명을 즉시 약물을 사용한 사람들과 그렇지 않은 사람들로 나눌 수 있습니다 그래서 5 %는 실제로 약물을 95 %는 약물을 사용하지 않았습니다 10,000명 중 5 %는 무엇일까요? 그것은 500이 될 것입니다 약 500명이 약물을 사용합니다 다시 한번, 이것은 원래 인구의 5%입니다 얼마나 많은 사람들이 약물을 사용하지 않습니까? 9,500명이 약물을 사용하지 않았습니다 다시 한번, 이것은 지원자 그룹의 95%입니다 이제 테스트를 시작해 봅시다 그러면 약물 사용자에게 이 테스트를 시행했을 때 어떤 일이 발생할까요? 이상적으로는, 양성이라는 결과를 줄 것입니다 약물 사용자 모두에게 양성 판정을 줄 것입니다 그러나 이 테스트는 완벽하지 않습니다 그들 중 일부에게는 음성 판정을 줄 것입니다 그들 중 일부에게는 거짓으로 음성 판정을 줄 것입니다 그리고 이 실험에는 1%의 거짓 음성 비율이 주어졌기 때문에 이 500명 중 99%가 올바르게 양성 판정을 받을 것입니다 그렇다면 500의 99%는 무엇입니까? 봅시다 답은 495입니다 495명이 양성 판정을 받을 것입니다 여기에 양성 표시를 해 두겠습니다 그리고 나서 1%인 5명이 남습니다 이들은 음성 판정을 받을 것입니다 이들은 거짓으로 음성결과를 받을 것입니다 이것이 거짓 음성 비율입니다 지원자들 중 몇 퍼센트가 약물을 사용했고 검사에서 양성 판정을 받았는지 묻는다면 495/10,000입니다 이것은 4.95%입니다 지원자들 중 몇 퍼센트가 약물을 사용했지만 음성 판정이 나올까요? 약물을 사용했지만 음성 판정이 나올까요? 10,000명 중 5명이 될 것입니다 0.05%입니다 이 결과를 얻는 또 다른 방법은 5 %에 1%를 곱하는 것입니다 그러면 0.05 %를 얻게 됩니다 1 퍼센트의 1/500이죠 5%에 99%를 곱하면 4.95%를 얻게 될 것입니다 이제 계속 해 봅시다 이제 약물을 사용하지 않은 사람들에게 가 봅시다 그리고 이들에 대해서는 거짓 양성 비율이 영향을 끼칠 것입니다 2%의 거짓 양성 비율을 가지고 있습니다 따라서 2 %는 양성 반응을 보일 것입니다 9,500의 2%는 무엇일까요? 190명은 양성 반응을 보일 것입니다 비록 그들이 약물을 하지 않았어도 말입니다 이것이 거짓 양성 비율입니다 이 사람들은 테스트에서 양성 판정을 받습니다 다른 98%는 올바르게 음성 판정이 나옵니다 나머지 98%는 9,500에서 190을 뺀 것입니다 9,310명이 올바르게 테스트에서 음성 판정을 받게 됩니다 총 지원자들 중 몇 퍼센트인가요? 190은 1.9%입니다 190/10,100으로 계산할수도 95%의 2%는 1.9%라고 할 수도 있습니다 다시 한번, 트리의 경로에 따라 곱하면 됩니다 9,310는 몇 퍼센트일까요? 93.10%가 될 것입니다 이 값을 9,310/10,000이라고 할 수도 있고 또는 이 확률 트리의 경로를 따라 확률을 곱해서 구할 수도 있습니다 95% x 98%는 93.10%입니다 이제 문제의 질문에 답할 준비가 되었습니다 지원자가 양성 판정을 받았을 때 실제로 약물을 사용했을 확률은 얼마일까요? 먼저 첫 부분을 살펴 보겠습니다 지원자가 양성 반응을 보였다면 어떤 지원자들에게서 양성이 나오나요? 여기 495명의 양성 반응 지원자들이 있습니다 올바르게 검사된 양성 판정 입니다 그리고 여긴 190명의 양성 반응이 나와선 안 되지만 양성 반응이 나온 지원자들이 있습니다 그러면 얼마나 많은 사람들이 양성일까요? 495 + 190명의 사람들이 양성입니다 이 숫자가 양성 판정을 받은 총 지원자 수입니다 그 중 누가 실제로 약물을 사용했나요? 양성 판정이 나온 사람들 중 495 명이 실제로 약물을 섭취한 것입니다 495/(495 +190)는 0.7226입니다 495/(495 +190)는 0.7226입니다 495/(495 +190)는 0.7226입니다 약 72%라고 할 수 있습니다 약 72%라고 할 수 있습니다 이것은 정말로 흥미롭습니다 지원자가 양성 판정을 받았을 때 실제로 약물을 사용했을 확률은 얼마일까요? 이 거짓 양성 및 거짓 음성 비율은 아주 낮은 확률로 보입니다 하지만 지금 실제로 계산한 결과 누군가 정말로 약물을 사용했을 확률은 높긴 하지만 매우 높진 않습니다 누군가가 검사에서 양성 판정을 받았어도 저 사람은 진짜 약물을 썼다고 하기는 힘듭니다 그리고 백분율을 사용해서 이 결과를 얻을 수도 있습니다 예를 들어, 원래 지원자의 몇 퍼센트가 양성 반응을 보이는지 생각해 볼 수도 있습니다 4.95%와 1.9%를 더합니다 펴센트로 계산하도록 하겠습니다 그 중 몇 퍼센트가 실제로 약물을 사용했나요? 그게 4.95 %였습니다 이것은 위와 정확히 똑같은 결과를 보입니다 이제 여기 흥미로운 결과가 나왔습니다 검사에서 양성을 받은 사람들 중 72%가 실제로 약물을 사용한다고 결과는 말하고 있습니다 다른 방향으로도 생각할 수 있습니다 검사에서 양성을 받은 사람들 495 + 190, 몇 퍼센트가 약물을 복용하지 않았나요? 190명이었습니다 이는 약 28%입니다. 100%에서 72%를 뺀 것 입니다 법정에서 검사가 법정에서 검사가 피고인이 양성 반응을 보였다고 한다면 검사는 이 검사는 아주 좋고 오직 2%의 거짓 양성 비율을 가진다고 말하고 살만 칸은 양성 반응을 보였고 아마도 마약을 복용하고 있을 것이라 한다면 이걸 제대로 이해하지 못했거나 이렇게 문제를 풀어보지 않은 배심원단은 아마 마약을 사용했을 것이라고 생각할 것입니다 그러나 이 결과를 보면 검사에서 양성 반응을 보였지만 마약을 하지 않았을 28%의 확률이 있습니다 제가 이 거짓 양성 그룹에 들어있는 경우입니다 그리고 이 숫자가 왜 이 숫자보다 더 크냐면 약물을 섭취한 사람과 섭취 안한 사람을 비교했을 때 대부분의 사람들은 약물을 섭취하지 않습니다 대부분은 불법 약물을 복용하지 않습니다 이 약물을 복용하지 않는 큰 그룹의 2%는 이것은 실제로 약물을 섭취하고 양성 판정을 받은 지원자들과 비교하면 꽤 큰 숫자입니다 여기까지 하겠습니다 이것은 이 특별한 경우에만 흥미로운 것이 아니라 이런 분석 방법을 자주 보게 될 것입니다 어떤 약이 효과적인지 어떤 절차가 효과적인지 알고 싶을 때 말입니다 그럴 때 이 분석을 할 수 있어야 합니다