If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

t-통계량이란?

왜 t-통계량을 사용하는지 알아봅시다.

동영상 대본

모집단과 관련된 모수를 수차례 본 적이 있죠 후보자를 지지하는 모집단의 비율일 수도 있고 모평균일 수도 있습니다 시민들의 평균 키와 같이 말이죠 실제 모수를 파악하는 방법은 존재하지 않거나 실용적이지 않음을 확인하였습니다 하지만 표본을 추출하여 이를 추정할 수 있습니다 따라서 표본의 크기 n을 추출하고 이를 바탕으로 통계량을 추정합니다 이 모수를 추정하면서 통계량을 계산할 수 있을 뿐만 아니라 특정한 신뢰수준을 바탕으로 통계량의 신뢰구간을 만들 수 있습니다 따라서 신뢰구간은 다음과 같을 것입니다 이것은 방금 계산한 통계량이고 여기에 ±오차범위가 있습니다 보통 이를 임계값 z라 부르고 이것은 통계량의 위, 아래로 가는 표준편차를 바탕으로 합니다 따라서 여기에 통계량에 대한 표본분포의 표준편차를 곱합니다 이제 생소한 개념을 살펴보려고 합니다 이를 알기 위해서 이 모수를 알아야 합니다 예를 들어, 추정하고 만들려는 신뢰구간에 대한 모수는 모비율입니다 특정 후보를 지지하는 모집단의 비율은 얼마일까요? 이 경우 통계량은 표본비율입니다 표본이율 ± z* 모비율을 모르는 이상 이것을 계산할 수 없습니다 대신 통계량의 표준오차를 추정합니다 p^(1-p^) 표본비율과 1-표본비율의 곱 나누기 표본의 크기 추정하려는 모수가 모평균이고 통계량은 표본평균입니다 이 경우 통계량은 표본평균에서 ±z* 입니다 이 모집단의 표준편차를 알고 있다면 통계량의 표본분포의 표준편차를 알 수 있습니다 이는 모집단의 표준편차를 표본 크기의 제곱근으로 나눈 것입니다 하지만 이 값은 일반적으로 모릅니다 사실 이 값을 아는 경우가 드물죠 이 값을 모른다면 이 표본의 표본표준편차를 구해봅시다 표본평균 ± z* × 표본표준편차 이는 계산할 수 있죠 ÷ √n 표본평균에 대한 신뢰구간을 만드는 데 아주 적절해 보입니다 하지만 사실은 적절하지 않습니다 왜냐하면 이 부분이 실제 구간, 즉 신뢰수준에 대한 실제 오차범위를 과소평가하였기 때문입니다 그래서 통계학자들이 다른 통계량을 개발하였습니다 z 대신 t를 표준정규분포표 대신 t-분포표를 사용합니다 추후 강의에서 살펴볼 예정입니다 표본평균에 대한 신뢰구간을 만든다면 정규화된 모집단의 실제 표준편차를 모른다면 이런 방법 대신 표본평균 ± 임계값 이를 t*로 부릅니다 × 표본표준편차 ÷ √n 기능적인 차이점은 이것이 우리가 원하는 신뢰수준에 대한 신뢰구간을 만들어 줍니다 신뢰수준이 95%라면 여러 가지 표본으로 반복하여 계산하면 대략 95%의 확률로 실제 모평균을 포함할 것입니다 기능적으로 풀기 위해 추후에 강의하겠지만 표준정규분포표 대신 t-분포표를 이용해야 합니다