주요 내용
확률과 통계
코스: 확률과 통계 > 단원 12
단원 1: 유의성 검정의 원리모의시험에서 P-값 추정하기
모의시험에서 P-값을 추정해 영가설이 참이라 가정할 때의 표본분포를 추정하는 예제를 살펴봅시다.
동영상 대본
p값에 관한 문제입니다 에비가 읽은 기사에 따르면 청소년의 6%가
채식주의자라고 합니다 하지만 그녀는 그녀가 다니는 학교에서
그 비율이 더 높다고 생각합니다 이를 검증하기 위해
학생 25명의 임의표본을 추출하였습니다 그 중 20%가
채식주의자였습니다 첫 번째 그래프에 대하여 흥미로운 이야기가 나와있네요 실제 모비율은 이 기사에 따르면 채식주의자 청소년은 6%라고 합니다 그녀의 학교에 대한
귀무가설은 채식주의자인 학생의 비율은 채식주의자인 학생의 비율은 귀무가설에서는
그 비율이 동일합니다 귀무가설에서는
그 비율이 동일합니다 이것이 귀무가설입니다 대립가설도 있겠죠 대립가설도 있겠죠 그녀가 다니는 학교에서
그 비율이 더 높다고 생각합니다 대립가설은 다음과 같습니다 그녀의 학교에 대한
실제 모비율은 6%보다 큽니다 표본을 추출하여 귀무가설 기각 여부를
살펴보는 것이 에비가 한 일입니다 학생 25명의
임의표본을 추출하였고 같은 비율을 계산합니다 표본비율을 얻을 확률이 이 값보다 높은지 구합니다 만약 그 값이 한계점보다 낮다면 귀무가설을 기각하게 됩니다 그 확률을 p값이라고 부릅니다 p값은 표본비율 즉, 그녀의 학교
학생들에 대한 비율이 20% 이상일 확률입니다 귀무가설이 참이라고
가정한다면 말이죠 실제 비율이 6%라고 가정했는데 실제 비율이 6%라고 가정했는데 25명의 표본에서 20%를 얻었다면
25명의 표본에서 20% 이상을 얻을 확률은
얼마일까요? 여러 접근 방법이 있습니다 그 중에서
시물레이션을 이용했네요 이와 같은 표본이 우연히 발생할 가능성을
알아보기 위해 시물레이션을 수행하였습니다 채식주의자가 6% 있는
모집단으로부터 학생 25명의 표본
40개를 대상으로 시물레이션을 진행하였습니다 각 표본에서 채식주의자
비율을 기록하였습니다 다음은 표본 40개의
표본비율입니다 시물레이션을 통해 귀무가설이 참이라는
가정을 바탕으로 표본비율의 표본분포를 나타낸 것입니다 아래를 살펴보면 에비는 실제 비율이 6%라는
귀무가설과 에비는 실제 비율이 6%라는
귀무가설과 실제 비율이 6% 이상이라는
대립가설을 비교하여 판별합니다 여기서 p는 교내의 채식주의자
비율을 나타냅니다 질문은 다음과 같습니다 시물레이션 결과를 바탕으로 p의 근사값은 무엇일까요? 그 결과 표본비율은 20%라고 합니다 여기서 확인했죠 이 자료가 표본비율의 표본분포로 적절히 나타낸 것이라면 40개의 측정값이 있고 그 중에서 표본비율이 20% 넘는 것은
얼마나 있나요? 여기가 20%
즉 20/100이므로 조건을 만족하는 표본이 3개 있습니다 3/40이죠 이 표본이 타당하다면 p값은 대략 20%입니다 3/40입니다 실제 비율이 6%라면 귀무가설이 참이라면 채식주의자의 비율이 20% 이상인 표본을 얻을 확률이 3/40이 되는 것입니다 3/40은 뭐죠? 분모와 분자에 2.5를 곱하면 이렇게 되겠죠 40에서 100이 되고 3에서 7.5가 됩니다 따라서 이 값은 7.5%입니다 여러 보기가 있는데 아래로 내리면 7.5%가 정답이 됩니다 7.5%가 정답이 됩니다