주요 내용
주어진 z-통계량에서 P-값 계산하기
표준정규표를 사용해 P-값을 추정하는 예제를 살펴봅시다.
동영상 대본
페리가 읽은 기사에 따르면 미국인의 26%가 두 언어 이상
구사할 수 있다고 합니다 그녀가 사는 도시에
이 비율이 더 높다고 생각하였습니다 그래서 그녀가 사는
도시에서의 비율이 전국 비율인 26%라는 귀무가설과 26%보다 높다는 대립가설을 비교합니다 p는 그녀가 사는 도시에서 두 언어 이상을 구사하는
사람들의 비율입니다 120명의 표본 중에서 40명이 두 언어
이상을 구사합니다 여기 모집단이 있습니다 표본을 추출하는데 그 크기는 120입니다 표본비율을 계산합니다 40/120 = 1/3 40/120 = 1/3 대략 0.33이죠 검정통계량을 계산한 결과 z = 1.83 입니다 지난 강의에서 다루었지만 이 값을 어떻게 구했는지
다시 떠올려 보자면 가정한 비율보다 얼마나 많은 표준편차가
있는지에 대한 값입니다 기억하세요
귀무가설이 참이라는 가정 하에 유의성 검정을
진행하고 있습니다 적어도 이런 극단적인 값을 얻는 확률을 구하고자 합니다 얻는 확률을 구하고자 합니다 이 값이 한계점보다 낮다면 귀무가설을 기각하고 대립가설이 타당해집니다 z 통계량은 가정한 비율보다 얼마나 많은 표준편차가
있는지 나타냅니다 z 통계량은 이전 시간에 배웠습니다 표본비율인 0.33과 표본비율인 0.33과 표본비율인 0.33과 가정한 실제 비율 사이의
차이를 구합니다 0.33 - 0.26 이 값을 표본비율의 표본분포의
표준편차로 나눕니다 기억나나요? 가정한 비율을 넣고 가정한 비율을 넣고 1에서 이 비율을
뺀 값을 곱합니다 그리고 n으로 나눕니다 이 문제에서는 이 값은 0.26이고 × (1 - 0.26) ÷ n n = 120 이를 계산하면 대략 1.83이 나옵니다 좋습니다 필요한 조건들은 만족한다고 나와 있네요 표본비율의 표본분포를 가정하는데 필요한 조건은 정규분포를 따르는 것과 임의성 조건 일반성 조건 독립성 조건입니다 저번에 배운 내용입니다 p값은 대략 무엇일까요? p값은 p값은 정규분포에서 필요한 조건들은 만족하므로 표본분포가 정규분포를
따른다고 볼 수 있습니다 따라서 정규분포에서 z ≥ 1.83 인 확률을 무엇일까요? z ≥ 1.83 인 확률을 무엇일까요? 이를 시각하하기 위해 표본분포의 형태를 살펴봅시다 표본분포의 형태를 살펴봅시다 정규분포를 따릅니다 표본분포의 평균은 가정한 모비율입니다 따라서 p0이죠 p0은 귀무가설로부터 가정한 모비율입니다 즉, 0.26이죠 표본으로부터 얻은 이 결과는 표준편차 1.83입니다 이는 표본분포의 평균으로부터
얼마나 떨어져 있는지 나타내죠 1.83 따라서 1.83입니다 그러므로 이 확률은 곡선의
한쪽 끝 면적을 나타냅니다 이 확률은 곡선의
한쪽 끝 면적을 나타냅니다 표준정규분포표를 살펴보죠 이 표준정규분포표로 z값의 왼쪽 면적을
구할 수 있습니다 z값의 오른쪽 부분을
구하고자 합니다 그런데 정규분포는 대칭입니다 평균으로부터 위로 1.83
이상만큼 떨어진 것은 평균으로부터 위로 1.83
이상만큼 떨어진 것은 평균으로부터 아래로 1.83
이하만큼 떨어진 것과 같습니다 평균으로부터 아래로 1.83
이하만큼 떨어진 것과 같습니다 따라서 이 값은
-1.83입니다 표준정규분포표를 살펴봅시다 표준정규분포표를 살펴봅시다 여기 -1.83이 있네요 여기 -1.83이 있네요 0.0336입니다 구했습니다 이 값은 대략 0.0336입니다 3%보다 살짝 크고
4%보다 살짝 작네요 이제 미리 설정한 유의수준과 비교합니다 유의수준과 비교합니다 유의수준이 5%라면 이 값은 유의수준보다
낮기 때문에 이 값은 유의수준보다
낮기 때문에 귀무가설을 기각할 수 있습니다 귀무가설이 참이라고 가정하면 이 결과를 얻을 확률이 이 결과를 얻을 확률이 한계점보다 낮습니다 그렇죠? 따라서 귀무가설을 기각합니다 그리고 대립가설이 타당해집니다 그러나, 유의수준이 이 값보다 낮게 된다면 만약 유의수준이 1%라면 귀무가설을 기각할 수 없습니다