주요 내용
확률과 통계
오류와 유의성의 결과
어떤 오류가 더 심각한 결과를 초래하는지 생각해 보고, 그런 오류를 방지하기 위해 유의수준을 조정하는 방법을 연습해 봅시다.
소개
유의성 검정은 유의수준 를 주로 사용하지만, 어떤 경우에는 다른 유의수준을 쓰는게 맞습니다. 를 바꾸는 것은 1종 오류와 2종 오류의 오차 확률에 영향을 미칩니다. 어떤 검정에서, 한 오류가 다른 것보다 더 심각한 결과를 초래합니다. 이러한 경우들에서 의 여러 가지 값을 선택하고자 합니다.
복습 : 오차확률과
1종 오류는 귀무 가설을 기각할 때입니다. 값이 너무 작으면 귀무가설을 기각하기 힘들어지므로, 작은 의 값을 고르는 것은 1종 오류의 확률을 줄여줍니다. 그 결과 귀무가설이 거짓이라면 작은 의 값을 이용하여 기각하기 더 힘들어집니다. 따라서 작은 의 값을 이용하면 2종 오류의 확률이 커집니다.
2종 오류는 거짓인 귀무가설을 기각하지 못할 때입니다. 높은 의 값은 귀무가설을 기각하기 쉽게 만들므로, 높은 의 값을 고르는 것은 2종 오류의 확률을 줄여줍니다. 그 결과 귀무가설이 참이라면, 높은 는 1종 오류를 저지르게끔(참인 귀무가설을 기각하게끔) 만듭니다.
몇 가지 예시를 통해 높거나 낮은 유의수준을 사용하는게 왜 맞는지 살펴봅시다.
예제 1
헬스클럽의 직원들은 클럽의 수영장의 수질 검사를 매일 진행합니다. 오염도가 너무 높으면, 복구시키기 위해 임시로 수영장을 폐쇄합니다.
이 검사에 대한 가설은 수질이 괜찮음 vs. 수질이 나쁨 입니다.
한 가지 오류가 더 큰 안전 문제를 수반하므로, 클럽은 수질 유의성 검사에 대하여 가 아닌 를 사용해야 합니다.
예제 2
세스는 푸드 트럭 사업을 시작하는데, 장사할 도시를 고르고 있습니다. 주민들을 조사하고 운영 허가를 받기 전에 수요가 충분히 높아 사업이 잘 될지 시험합니다. 수요가 충분히 높다는 강력한 증거가 있다면 그 도시 하나만을 고를 것입니다.
이 검사에 대한 가설은 수요가 높지 않음 vs. 수요가 높음입니다.
1종 오류가 2종 오류보다 비용이 더 많이 든다고 생각하였습니다. 1종 오류의 가능성을 줄이기 위해 가 아닌 다른 유의수준을 사용하고자 합니다.