If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

참고: 평균 추론에 필요한 조건

평균(신뢰구간 구축 혹은 유의성 검정)에 대한 추론을 수행하고자 할 때, 몇 가지 조건에 따라 방법의 정확도가 달라집니다. 구간 혹은 검정에 대하여 실제로 계산하기 전에, 이 조건들이 만족하는지 확인하는 것이 중요합니다. 그렇지 않으면 계산과 결론은 정확하지 않게 됩니다.
평균에 대한 추론에 필요한 조건은 다음과 같습니다:
  • 임의성: 자료는 임의표본 혹은 임의 실험으로부터 나와야 합니다.
  • 일반성: x¯(표본평균)의 표본분포는 정규분포를 따라야 합니다. 모집단이 정규분포를 따르거나 표본의 크기가 충분히 커야 (n30) 참입니다.
  • 독립성: 각각의 관측값은 독립이어야 합니다. 비복원추출을 한다면, 표본의 크기는 모집단의 10%를 초과하면 안됩니다.
이 조건들을 좀 더 깊게 살펴봅시다.

임의성 조건

임의 표본은 모집단으로부터 편견 없는 자료를 제공합니다. 임의 선택을 하지 않을 때, 그 결과는 편견이 형성되므로, 모집단에 대한 무언가를 추론할 때 사용한다면 위험할 수 있습니다.
구체적으로, 표본평균은 모평균의 편견 없는 추정치입니다. 예를 들어, 탁구공 한 바구니에 공이 0 ~ 30개 있다고 가정하면, 바구니의 모평균은 15입니다. 바구니에서 공의 임의표본을 추출하고 각 표본으로부터 평균을 계산합니다. 어떤 표본평균은 15 이상이고 어떤 표본은 그렇지 않습니다. 하지만 평균적으로, 각 표본의 평균은 15로 동일합니다. 임의표본을 추출한다는 가정 하에 이 특징을 μx¯=μ라고 나타낼 수 있습니다.
이것은 표본이 임의추출되지 않는다면 일어나지 않습니다. 편향된 표본은 부정확한 결과를 낳으므로, 신뢰구간을 형성하거나 유의성 검정을 시행할 수 없습니다.

일반성 조건

x¯(표본평균)의 표본분포는 여러 다른 경우에 대해서 정규분포를 따릅니다. x¯의 표본분포 형태는 대부분 모집단분포의 형태와 표본의 크기 n에 좌우됩니다.

경우 1 : 모집단이 정규분포를 따릅니다.

모집단이 정규분포를 따른다면, x¯의 표본분포는 표본의 크기와 상관없이 정규분포를 따릅니다. 따라서 모집단이 정규분포를 따른다는 것을 알고 있다면, 표본의 크기가 작더라도 이 조건을 건너뜁니다. 하지만, 실제로는 모집단이 정규분포를 따르는지 알 수 없습니다.

경우 2 : 모집단이 정규분포를 따르지 않거나 알 수 없습니다. 표본의 크기는 충분히 큽니다. (n30)

x¯의 표본분포는 표본의 크기가 크다는 가정 하에 정규분포를 따릅니다. 중심극한정리에 의해, n30 일 때, x¯의 표본분포는 모집단분포의 형태와 상관없이 정규분포를 따릅니다.
모집단분포의 형태가 일반적이지 않은, 표본평균 x¯의 표본분포가 표본의 크기가 30에 가까운 경우에 대하여 정규분포를 따르지 않는 보기 드문 경우가 존재합니다. 이 경우는 희귀하므로, 실제로 n30일 때 표본분포가 정규분포를 따른다고 가정하는 것이 안전합니다.

경우 2 : 모집단이 정규분포를 따르지 않거나 알 수 없습니다; 표본의 크기는 작습니다. (n<30)

모집단에 이상치 혹은 강한 왜곡이 존재하지 않는 한, 매우 작은 표본이라도 x¯의 분포는 정규분포를 따릅니다. 실제로, 모집단분포의 형태를 확인할 수 없는데, 표본에서 자료의 분포를 바탕으로 그 형태를 추론할 수 있습니다. 표본의 자료가 왜곡되거나 이상치라면, 모집단이 정규분포를 따를 수 있는지 의심해야 하고, 따라서 x¯의 표본분포 또한 정규분포를 따르지 않을 수도 있습니다. 그러나 표본자료가 대칭성을 이루고, 이상치가 없거나 왜곡되지 않았다면, x¯의 표본분포는 정규분포를 따른다고 할 수 있습니다.
주요 개념은 n<30일 때 표본자료를 그래프로 나타내야 하고, 이에 따라 그래프의 형태를 바탕으로 일반성 조건에 대한 결정을 내려야 한다는 것입니다.

독립성 조건

x¯의 표준편차에 대한 공식을 사용하기 위해서, 각 관측값이 독립이어야 합니다. 좋은 실험 설계는 실험 대상(대조군, 실험군, 무작위성) 사이의 독립성에 주의를 기울입니다.
비복원추출을 포함하는 관측연구에서, 각 관측값은 엄밀히 말하면 독립이 아닙니다. 관측값을 제거하면 모집단이 변화하기 때문입니다. 하지만 10% 조건에 따르면 표본의 크기가 모집단의 10% 이하라면, 관측값을 제거해도 모집단에 큰 영향을 미치지 않으므로 관측값이 독립이라고 할 수 있습니다. 예를 들어, 표본의 크기가 n=30이라면, 모집단의 크기는 독립성 조건을 만족하기 위해서 적어도 N=300이 되어야 합니다.
관측값의 독립성을 가정하면, 신뢰구간을 만들거나 유의성 검정을 시행할 때 x¯의 표준편차에 대한 공식을 사용할 수 있습니다.
σx¯=σn
보통 모표준편차 σ를 모르기 때문에, σ의 추정치로써 표본표준편차 sx로 대체합니다. 이를 표준편차와 구분하기 위해 x¯표준오차라고 부릅니다.
따라서 x¯의 표준오차에 대한 공식은 다음과 같습니다:
σx¯sxn

요약

세 조건 모두 만족한다면, t 분포를 사용하여 신뢰구간을 만들거나 유의성 검정을 시행할 수 있습니다. 이 조건들을 만족하면 계산이 정확해지고 결론에 대한 신뢰성이 높아집니다.
임의성 조건은 아마 제일 중요할 것입니다. 무작위 조건이 깨진다면, 자료가 편향될 것입니다. 편향된 표본을 고치는 유일한 방법은 자료를 편향되지 않은 방법으로 재추출하는 것입니다.
다른 두 조건 또한 중요하지만, 일반성 조건 혹은 독립성 조건을 만족하지 않더라도, 다시 시작할 필요는 없습니다. 예를 들어, 표본이 모집단의 10% 초과일 때 부족한 독립성을 수정할 수 있지만, 지금 배우는 내용을 벗어납니다.
중요한 것은 신뢰구간을 만들거나 유의성 검정을 시행하기 전에 조건들이 확실히 만족하는지 검증하는 것입니다.