If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

분산 분석법 2: 평균 내 제곱합과 평균 간 제곱합의 계산

분산 분석법 2 - 평균 내 제곱합(SSW)과 평균 간 제곱합(SSB)의 계산. 만든 이: 살만 칸 선생님

동영상 대본

지난 동영상에서는 여기 있는 측정점 아홉 개의 총 제곱의 합을 계산해 보았습니다 측정점 아홉 개의 총 제곱의 합을 계산해 보았습니다 그리고 이 측정점 아홉 개는 세 개의 집합으로 나뉘어있고 일반적으로 말하면 m개의 집합입니다 이 동영상에서는 이 총제곱합의 얼마가 각 집합 내 변화량 때문이며 얼마가 집합 간의 변화량 때문인지 알아보도록 하겠습니다 그러면 먼저 각 집합 내 총 변화량을 그러면 먼저 각 집합 내 총 변화량을 SSW라고 하겠습니다 SSW라고 하겠습니다 SSW라고 하겠습니다 SSW라고 하겠습니다 SSW라고 하겠습니다 SSW라고 하겠습니다 SSW라고 하겠습니다 SSW라고 하겠습니다 SSW라고 하겠습니다 변화량의 얼마가 각 측정점이 각각의 평균에서 얼마나 떨어져 있기 때문인지 알아보는 것입니다. SSW는 다음과 같습니다 1번 집합부터 시작하죠 각 측정점에서 평균의 평균까지를 계산하는 것이 아니라 각 측정점에서 평균의 평균까지를 계산하는 것이 아니라 각 측정점에서 그 측정점 집합의 평균까지의 거리를 계산합니다 각 측정점에서 그 측정점 집합의 평균까지의 거리를 계산합니다 각 측정점과 그 집합 평균의 총 제곱의 합을 구하는 것이기 때문입니다 각 측정점과 그 집합 평균의 총 제곱의 합을 구하는 것이기 때문입니다 평균이 2이니까 (3 - 2)² + (2 - 2)² +(1- 2)² 평균이 2이니까 (3 - 2)² + (2 - 2)² +(1- 2)² 평균이 2이니까 (3 - 2)² + (2 - 2)² +(1- 2)² 모든 집합을 이렇게 계산합니다 각 집합은 측정점에 그 집합의 평균을 사용하고요 각 집합은 측정점에 그 집합의 평균을 사용하고요 그러면 (5- 4)² +(3 - 4)² +(4 - 4)²를 더해 주고요 그러면 (5- 4)² +(3 - 4)² +(4 - 4)²를 더해 주고요 그러면 (5- 4)² +(3 - 4)² +(4 - 4)²를 더해 주고요 마지막으로 세 번째 집합입니다 지금 각 측정점에서 그 측정점의 중심경향성까지의 제곱의 합을 구하고 있고 그것을 모두 더할 것입니다 그럼 3번 집합은 (5 - 6)² + (6 - 6)² + (7 - 6)²입니다 (5 - 6)² + (6 - 6)² + (7 - 6)²입니다 계산해보면 계산해보면 위에는 1 + 0 + 1 그럼 2이고 중간은 1 + 1 + 0이니까 이것도 2네요 마지막은 1 + 0 + 1입니다 7 - 6 = 1이고 제곱하면 1이죠 따라서 2를 더해 줍니다 따라서 2를 더해 줍니다 SSW는 6입니다 SSW는 6입니다 총 변화량이 30이었는데 이 계산에 의하면 30 중에 6이 표본 간 변화량 때문입니다 이 다음엔 이 계산의 자유도를 생각해 보아야 합니다 독립적인 측정점이 몇 개냐고 하는 것입니다 왼쪽을 보면 각 집합에 측정점이 3개 있습니다 각 집합에 측정점이 3개 있습니다 하지만 그 중 n - 1개를 알면 나머지 n번째는 계산으로 얻을 수 있습니다. 실제 표본평균을 알고 있다면요 따라서 이 경우 어느 집합이던 측정점 두 개를 알면 세 번째를 찾을 수 있습니다 이 두 개를 알면 세 번째는 항상 알 수 있죠 표본평균을 안다면 자유도의 일반적인 공식을 찾아봅시다 방금처럼 하면 각 집합의 자유도는 n - 1입니다 n은 각 집합에 있는 측정점의 개수이고요 n은 각 집합에 있는 측정점의 개수이고요 따라서 각 집합의 자유도는 n - 1입니다 따라서 각 집합의 자유도는 n - 1입니다 n - 1, n - 1, n - 1이죠 아니면 각 집합의 자유도가 n -1이고 집합이 m개 있으니까 집합이 m개 있으니까 자유도는 m(n -1)입니다 자유도는 m(n -1)입니다 이 경우 n -1은 2이고 이 경우 n -1은 2이고 집합이 세 개 있으니까 자유도는 6입니다 자유도는 6입니다 그리고 나중에 자유도가 어떤 의미이고 수학적으로 어떻게 생각할 수 있는지 자세히 토론해 보도록 하겠습니다 수학적으로 어떻게 생각할 수 있는지 자세히 토론해 보도록 하겠습니다 지금은 독립적인 측정점이라고 생각하는 것이 가장 쉽습니다 지금은 독립적인 측정점이라고 생각하는 것이 가장 쉽습니다 각 거리의 제곱을 구할 때 사용한 중심 통계량을 알고 있다고 가정할 때요 중심 통계량을 알고 있다고 가정할 때요 알고 있다면 세 번째 측정점은 나머지 두 개로 계산해 낼 수 있습니다 자유도는 6이었습니다 그러면 총 변화량의 얼마가 각 표본 내 변화량 때문인지 알았으니 그러면 총 변화량의 얼마가 각 표본 내 변화량 때문인지 알았으니 얼마가 표본 간의 변화량 때문인지 알아봅시다 얼마가 표본 간의 변화량 때문인지 알아봅시다 계산해보죠 계산해보죠 계산해보죠 SSB라고 하겠습니다 SSB라고 하겠습니다 SSB라고 하겠습니다 다르게 생각해 보면 총 변화량의 얼마가 평균 간의, 그러니까 중심경향 간의 변화량 때문인지 계산하는 것입니다 평균 간의, 그러니까 중심경향 간의 변화량 때문인지 계산하는 것입니다 평균 간의, 그러니까 중심경향 간의 변화량 때문인지 계산하는 것입니다 그리고 얼마가 각 측정점에서 그 평균까지의 변화량 때문인지도요 그리고 얼마가 각 측정점에서 그 평균까지의 변화량 때문인지도요 얼마가 이것들 간의 변화량 때문인지 알아보죠 얼마가 이것들 간의 변화량 때문인지 알아보죠 얼마가 이것들 간의 변화량 때문인지 알아보죠 일단 1번 집합만 생각해 보세요 1번 집합에 이것들의 변화량 얼마만큼이 평균과 평균의 평균간 변화량 때문일까요? 평균과 평균의 평균간 변화량 때문일까요? 첫 번째 측정점에 대한 식을 써 보도록 할게요 변화량은 표본평균과 같습니다 (2 - 평균의 평균)을 제곱하고 그리고 두 번째 측정점도 똑같이 표본평균입니다 그리고 두 번째 측정점도 똑같이 표본평균입니다 (2 - 평균의 평균)을 제곱한 것이죠 세 번째 측정점도 같으니까 (2 - 평균의 평균)을 제곱해 더하면 다르게 생각해 보면 이것은 3(2 - 4)²이고 3(2 - 4)²이고 3 x 4이니까 12입니다 이것을 다른 집합에도 하면 됩니다 총 합을 구하고 있으니까 전부 써 볼게요 그게 더 쉽겠네요 이 모든 것의 표본 간 차에 의한 제곱합이 얼마인지를 구하고 있으니까요 얼마인지를 구하고 있으니까요 방금 한 것은 첫 번째 표본에서 나온 것이고 두 번째 표본에서 두 번째 표본에서 두 번째 표본에서 이 측정점의 평균간 차에 의한 변화량은 이 측정점의 평균간 차에 의한 변화량은 (4 - 4)²입니다 이것도 같고요 (4 - 4)²이죠 측정점 자체는 신경쓰지 않고 표본평균만으로 계산하고 있습니다 그리고 마지막도 (4 - 4)²입니다 각 측정점마다 집합의 평균에서 평균의 평균을 빼고 제곱했습니다 각 측정점마다 집합의 평균에서 평균의 평균을 빼고 제곱했습니다 마지막으로 3번 집합도 해 볼게요 3번 집합 표본평균은 6입니다 (6 - 4)² + (6 - 4)² + (6 - 4)²이네요 (6 - 4)² + (6 - 4)² + (6 - 4)²이네요 (6 - 4)² + (6 - 4)² + (6 - 4)²이네요 여기서 자유도는 몇일지 생각해 봅시다 여기서 자유도는 몇일지 생각해 봅시다 여기서 자유도는 몇일지 생각해 봅시다 가장 쉽게 생각해 볼 수 있는 방법은 평균의 평균을 안다고 가정할 때 정보를 몇 개나 가지고 있는지 생각해 보는 것입니다 평균의 평균을 안다면 여기서 새 정보는 몇 개일까요? 평균의 평균을 알고 있고 표본평균 두 개를 알고 있다면 세 번째는 구할 수 있습니다 이것과 이것을 알면 이것을 구할 수 있죠 그리고 이것과 이것을 알아도 이것을 구할 수 있습니다 이것이 이 평균들의 평균이기 때문입니다 따라서 일반적으로 m개 집합이 있을 때 또는 m개 평균이 있을 때 자유도는 m - 1입니다 또는 m 개 평균이 있을 때 자유도는 m - 1입니다 써 보죠 써 보죠 이 경우 m은 3이니까 여기서 자유도는 2라고 할 수 있겠네요 여기서 자유도는 2라고 할 수 있겠네요 이제 SSB를 계산해 볼게요 이제 SSB를 계산해 볼게요. 이제 SSB를 계산해 볼게요 이제 SSB를 계산해 볼게요 여기 이것은 2 - 4 = -2이고 제곱하면 4니까 첫째 줄에는 4가 세 개 있습니다 3 x 4 이고 둘째 줄은 3 x 0입니다 셋째 줄은 6 - 4가 2이고 제곱하면 4니까 3 x 4입니다 3 x 4입니다 그러면 3 x 4는 12에 0과 12를 더하면 24입니다 집합 간 차에 의한 변화량 혹은 평균간 차에 의한 변화량은 24입니다 집합 간 차에 의한 변화량 혹은 평균간 차에 의한 변화량은 24입니다 집합 간 차에 의한 변화량 혹은 평균간 차에 의한 변화량은 24입니다 다 합쳐 봅시다 측정점 9개의 총 변화량이 30이라고 했습니다 측정점 9개의 총 변화량이 30이라고 했습니다 여기 다시 써 볼게요 총제곱합은 30입니다 각 측정점과 그 측정점의 중심경향간의 제곱합을 구했습니다 각 측정점과 그 측정점의 중심경향간의 제곱합을 구했습니다 표본평균 말이죠 구해보니 6이 나왔습니다 따라서 SSW는 6입니다 그리고 자유도도 6이었죠 그리고 자유도도 6이었죠 식으로 나타내면 자유도는 m x( n -1)입니다 총제곱합의 자유도도 m x n -1이었습니다 총제곱합의 자유도도 m x n -1이었습니다 총제곱합의 자유도도 m x n -1이었습니다 열을 하나 만들어서 자유도를 써 볼게요 열을 하나 만들어서 자유도를 써 볼게요 이 경우는 8이었습니다 그리고 방금 표본 간의 제곱합을 구했습니다 그리고 방금 표본 간의 제곱합을 구했습니다 SSB는 24고요 자유도는 m - 1으로 2였습니다 자유도는 m - 1으로 2였습니다 재미있는 것은 이 분산분석이 모두 잘 맞아떨어지는 이유이기도 한데 다음 동영상에선 이것을 가설검정에 이용하는 방법을 알아보겠습니다 다음 동영상에선 이것을 가설검정에 이용하는 방법을 알아보겠습니다 다음 동영상에선 이것을 가설검정에 이용하는 방법을 알아보겠습니다 SSW + SSB = SST라는 것입니다 SSW + SSB = SST라는 것입니다 SSW + SSB = SST라는 것입니다 여기 있는 자료의 총 변화량은 여기 있는 자료의 총 변화량은 각 집합 내의 변화량과 각 집합 내의 변화량과 집합 간의 변화량을 더한 값인 것이죠 심지어 자유도도 그렇습니다 SSB는 자유도가 2밖에 되지 않고 SSW는 자유도가 6입니다 SSW는 자유도가 6입니다 2 + 6은 8이죠 바로 총제곱합의 자유도와 같습니다 바로 총제곱합의 자유도와 같습니다 식으로 살펴보면 더 잘 맞아 떨어집니다 SSB의 자유도는 m - 1였죠 SSB의 자유도는 m - 1였죠 SSW의 자유도는 m(n -1)입니다 SSW의 자유도는 m(n -1)입니다 둘을 더하면 m - 1 + mn - m인데 이 둘을 지우고 나면 자유도는 mn - 1이 되는데 이것은 정확히 총 제곱합의 자유도와 같습니다 이것은 정확히 총 제곱합의 자유도와 같습니다 지난 번 동영상과 이 동영상에서 했던 수 많은 계산의 목적은 처음 계산했던 이 총 변화량이 처음 계산했던 이 총 변화량이 이 두 변화량 요소의 합이라는 것을 확인하기 위함이었습니다 표본 간의 변화량과 표본평균 간의 변화량의 합 말입니다 표본평균 간의 변화량의 합 말입니다 어렵지 않았길 바랍니다