If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:7:39

분산 분석법 1: 총제곱합의 계산

동영상 대본

이번 동영상과 다음 두 개의 동영상에서는 이 자료 집합을 가지고 계산을 많이 해 볼 것입니다 이 자료 집합을 가지고 계산을 많이 해 볼 것입니다 계산하는 과정을 통해 분산 분석에 대한 직관이 생겼으면 합니다 분산 분석에 대한 직관이 생겼으면 합니다 이 동영상에서 처음 할 것은 총제곱합을 계산하는 것인데 이를 SST라고 하겠습니다 Sum of Squares Total의 약자입니다 이것은 분산의 계산에서 분자에 해당합니다 이것은 분산의 계산에서 분자에 해당합니다 각 측정점과 모든 측정점의 평균까지의 거리를 각 측정점과 모든 측정점의 평균까지의 거리를 제곱하고 더하는 것입니다 자유도로 나누는 것은 하지 않습니다 표본분산을 계산할 때처럼 말이죠 표본분산을 계산할 때처럼 말이죠 그럼 어떻게 할까요? 먼저 이 모든 것의 평균을 구해야 합니다 먼저 이 모든 것의 평균을 구해야 합니다 이를 전체 평균이라 하겠습니다 곧 이것이 각 자료 집합 평균의 평균과 같다는 것을 보여드리겠습니다 각 자료 집합 평균의 평균과 같다는 것을 보여드리겠습니다 그러면 전체 평균을 계산해 봅시다 3 + 2+ 1+ 5 + 3 + 4 + 5 + 6 + 7 이네요 3 + 2+ 1+ 5 + 3 + 4 + 5 + 6 + 7 이네요 3 + 2+ 1+ 5 + 3 + 4 + 5 + 6 + 7 이네요 측정점이 9개이니까 9로 나누어 줍니다 계산해보면 3 + 2 + 1 = 6 3 + 2 + 1 = 6 이것은 6이고 5 + 3 + 4 = 12 그리고 5 + 6 + 7 = 18입니다 6 + 12 = 18이고 18을 더하면 36이고 9로 나누면 4와 같습니다 이것이 평균의 평균과 같다는 것을 보여드리죠 이것이 평균의 평균과 같다는 것을 보여드리죠 집합 1의 평균은 초록색으로 할게요 집합 1의 평균은 3 + 2+ 1이고 6이니까 3으로 나누면 2입니다 집합 2의 평균은 합이 12이고 여기서 계산했죠 5 + 3 + 4 = 12이고 3으로 나누면 4입니다 측정점이 세 개이니까요 그리고 집합 3의 평균은 5 + 6 +7 = 18이고 3으로 나누면 6입니다 그리고 이 평균의 평균을 구하면 전체 평균을 다르게 본 것이죠 2 + 4+ 6 =12이고 평균이 3개니까 3으로 나누면 이번에도 4가 나옵니다 이것은 모든 집합에 있는 측정점의 평균 혹은 이것은 모든 집합에 있는 측정점의 평균 혹은 각 집합 평균의 평균이라 볼 수도 있습니다 어떻게 생각하던 평균을 구했으니 이제 총제곱합을 구하도록 하겠습니다 해 볼게요 총제곱합은 3 - 4 4는 여기에서 왔습니다 (3 - 4)² + (2 - 4)² + (1 - 4)² 이제 보라색은 보라색으로 (5 - 4)² + (3 - 4)² + (4 - 4)²도 더해 줍니다 (5 - 4)² + (3 - 4)² + (4 - 4)²도 더해 줍니다 (5 - 4)² + (3 - 4)² + (4 - 4)²도 더해 줍니다 세 개 남았어요 (5 - 4)² + (6 - 4)² + (7 - 4)²입니다 세 개 남았어요 (5 - 4)² + (6 - 4)² + (7 - 4)²입니다 계산해보면 3 - 4는 1이고 3 - 4는 1이고 제곱합니다 사실 -1이지만 제곱하면 1이죠 -2의 제곱 4와 -3의 제곱 9를 더해 줍니다 -2의 제곱 4와 -3의 제곱 9를 더해 줍니다 5 - 4는 1이고 제곱해도 1이고요 5 - 4는 1이고 제곱해도 1이고요 (3 - 4)²도 1입니다 (3 - 4)²도 1입니다 4 - 4 = 0이고요 과정이 보이도록 0을 쓰도록 하죠 과정이 보이도록 0을 쓰도록 하죠 마지막 측정점 세 개 남았습니다 (5 - 4)²은 1이고 (6 - 4)²은 4 맞죠? 2의 제곱이니까요 7 - 4 = 3이고 제곱하면 9입니다 더해보면 1 + 4+ 9는 5 + 9이고 14입니다 14입니다 여기도 14입니다 1 + 4 + 9는 14죠 여기도 14이고 이것은 2입니다 따라서 14 x 2는 28이고 2를 더하면 30이네요 따라서 14 x 2는 28이고 2를 더하면 30이네요 30입니다 따라서 제곱합은 그 전에 분산을 계산하고자 한다면 이것을 자유도로 나누면 됩니다 자유도 구하는 법은 여러번 배웠는데 여기에는 집합이 m개 있습니다 여기에는 집합이 m개 있습니다 여기에는 집합이 m개 있습니다 오늘은 이것을 증명해 보진 않겠지만 통계학 책에서 나오는 이상한 공식들이 통계학 책에서 나오는 이상한 공식들이 어디서 나오는지 보여드리겠습니다 직관적으로 알 수 있도록 말입니다 집합이 m개가 있고 각 집합은 원소를 n개 가지고 있습니다 원소는 총 몇 개인가요? m x n은 9 맞죠? 3 x 3이니까요 따라서 자유도는 측정점 - 1입니다 측정점 - 1입니다 평균의 평균을 알고 있다 가정한다면 9 - 1인 8개의 원소만이 새 정보를 제공합니다 9 - 1인 8개의 원소만이 새 정보를 제공하기 때문입니다 나머지 하나는 계산해서 찾을 수 있죠 마지막 원소일 필요도 없습니다 다른 8개가 있다면 이것도 계산할 수 있죠 원소가 8개 있으면 항상 평균의 평균을 사용해 아홉 번째 원소를 구할 수 있습니다 따라서 여기에는 독립적인 측정점이 8개라고 할 수 있습니다 더 일반적으로 m x n개 표본의 자유도는 m x n -1입니다 m x n개 표본의 자유도는 m x n -1입니다 m x n개 표본의 자유도는 m x n -1입니다 그리고 분산을 계산할 때는 30에서 m x n -1을 나눠주기만 하면 됩니다 이 문제에서 자유도는 8이고요 이 문제에서 자유도는 8이고요 원소가 9개인 이 집합 전체의 분산은 30 / 8입니다 원소가 9개인 이 집합 전체의 분산은 30 / 8입니다 원소가 9개인 이 집합 전체의 분산은 30 / 8입니다 이 동영상에선 여기까지 하고 다음 동영상에선 이 총제곱합, 총 변화량의 얼마가 이 총제곱합, 총 변화량의 얼마가 각 집합 안의 변화량에서 오고 얼마가 각 집합 간의 변화량에서 오는지 알아보겠습니다 이제 분산 분석이 어디에서 오는지 감이 오시나요? 이제 분산 분석이 어디에서 오는지 감이 오시나요? 전체 표본 9개의 변화량은 전체 표본 9개의 분산은 이 집합들이 서로 어떤 면에서든 다르다면 집합간의 차이에서 오는 변화량도 있고 집합 내의 차이에서 오는 변화량도 있을 것입니다 집합 내의 차이에서 오는 변화량도 있을 것입니다 이 둘을 계산하고 더하면 이 둘을 계산하고 더하면 총제곱합의 변화량과 같다는 것을 확인해 보겠습니다 총제곱합의 변화량과 같다는 것을 확인해 보겠습니다