If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

회귀직선 예제

회귀직선 예제를 살펴봅시다. 만든 이: 살만 칸 선생님

동영상 대본

지난 몇몇 동영상에서 복잡한 수학 계산을 많이 했습니다 지난 몇몇 동영상에서 복잡한 수학 계산을 많이 했습니다 건너뛴 사람도 있겠죠 계산을 통해 간단한 결과를 얻었습니다 직선까지의 제곱 거리를 이용해 오차를 잴 때의 최적의 회귀직선의 기울기와 y교점 공식을 구했습니다 최적의 회귀직선의 기울기와 y교점 공식을 구했습니다 그 공식은 여기 두고 볼 수 있도록 제가 써놓을게요 직선의 기울기는 (x의 평균) × (y의 평균) - (xy의 평균)을 직선의 기울기는 (x의 평균) × (y의 평균) - (xy의 평균)을 어려워 보이지만 걱정 마세요 잠시 후 예제를 풀어볼 테니까요 (x의 평균)² - (x²의 평균)으로 나눕니다 (x의 평균)² - (x²의 평균)으로 나눕니다 통계 수업이나 교과서에서 본 공식과 달라 보인다면 단순히 앞뒤가 바뀌었을 가능성도 있습니다 단순히 앞뒤가 바뀌었을 가능성도 있습니다 분자와 분모에 –1을 곱하면 (xy의 평균) - (x의 평균)(y의 평균)을 (xy의 평균) - (x의 평균)(y의 평균)을 (x²의 평균) - (x의 평균)²으로 나눈 것과 같습니다 (x²의 평균) - (x의 평균)²으로 나눈 것과 같습니다 둘 다 같은 공식입니다 분자와 분모에 –1을 곱했으니까 1을 곱한 것이나 마찬가지입니다 1을 곱한 것이나 마찬가지입니다 물론 m의 값이 어떤 수가 나오든 여기에 대입해서 b값을 구할 수 있어요 b = (y의 평균) - m입니다 b = (y의 평균) - m입니다 잘 보이도록 노란색으로 쓰겠습니다 m값을 구했죠 -m·(x의 평균)입니다 -m·(x의 평균)입니다 필요한 건 그게 다입니다 이제 활용해 볼까요? 점을 3개 만드는데 같은 직선 위에 있으면 안됩니다 그러면 재미가 없어요 그 점 3개를 여기에 그릴게요 한 점의 좌표는 (1, 2)라 합시다 여기가 (1, 2)입니다 여기가 (1, 2)입니다 그리고 점 (2, 1)도 있고 그리고 점 (2, 1)도 있고 좀 더 나아가서 (4, 3)에도 점을 하나 찍읍시다 좀 더 나아가서 (4, 3)에도 점을 하나 찍읍시다 좀 더 나아가서 (4, 3)에도 점을 하나 찍읍시다 여기 (4,3)이 있습니다 점 세 개를 찍었습니다 여기서 할 일은 최적의 회귀직선을 찾는 것입니다 아마 이렇게 생겼을 겁니다 아마 이렇게 생겼을 겁니다 증명한 공식을 가지고 실제로는 어떻게 생겼는지 볼까요? 위에 이런 것부터 먼저 계산하고 공식에 대입해서 푸는 것이 좋겠네요 공식에 대입해서 푸는 것이 좋겠네요 x의 평균이 뭐죠? x의 평균은 1 + 2 + 4를 3으로 나눈 값입니다 x의 평균은 1 + 2 + 4를 3으로 나눈 값입니다 계산하면 1 + 2 = 3에 4를 더하면 7 또 3으로 나누면 7/3이 됩니다 y의 평균은요? y의 평균은 2 + 1 + 3을 3으로 나눈 값입니다 y의 평균은 2 + 1 + 3을 3으로 나눈 값입니다 y의 평균은 2 + 1 + 3을 3으로 나눈 값입니다 2 + 1 = 3 3 + 3 = 6 6/3 = 2 6/3은 2입니다 xy의 평균도 구합니다 xy의 평균도 구합니다 첫 번째 xy의 값은 1 x 2 2 x 1과 4 x 3도 더해 줍니다 2 x 1과 4 x 3도 더해 줍니다 xy값이 세 개니까 3으로 나눠줍니다 계산 결과는 2 + 2 = 4 4 + 12 = 16 16/3이 나오네요 마지막으로 구할 것은 x²의 평균입니다 x²의 평균을 구합시다 첫 번째 x²의 값은 그냥 1²이겠죠 첫 번째 x²의 값은 그냥 1²이겠죠 2²과 4²을 더해줍니다 2²과 4²을 더해줍니다 측정점은 세 개입니다 1 + 4 = 5에 16을 더하면 21/3 = 7입니다 깔끔하게 떨어졌네요 이제 m값과 b값을 구해 봅시다 최적의 회귀직선의 기울기는 x의 평균, 즉 7/3에 x의 평균, 즉 7/3에 y의 평균 2를 곱하고 y의 평균 2를 곱하고 xy의 평균인 16/3을 뺍니다 그 밑의 분모는 x 평균의 제곱, (7/3)²에서 x 평균의 제곱, (7/3)²에서 x²의 평균을 뺍니다 7을 빼는 거죠 이제 계산해 봅시다 계산기를 꺼내고 싶지만 참겠습니다 계산기를 꺼내고 싶지만 참겠습니다 분수로 유지하는 게 좋으니까요 계산해 보겠습니다 이건 14/3 – 16/3 그 밑엔 49/9에 7을 빼줍니다 7을 분모가 9인 분수로 표현하면 63/9와 같습니다 분자는 -2/3입니다 분모에서 49 - 63은 뭔가요? -14/9가 나오죠 이것은 (-2/3)(-9/14)와 같습니다 이것은 (-2/3)(-9/14)와 같습니다 분자와 분모를 3으로 나누고요 마이너스 기호는 소거됩니다 3으로 나누면 이건 1이 되고 이건 3이 되고 2로 나누면 이건 1 이건 7이 됩니다 기울기의 값은 3/7입니다 나쁘지 않네요 이제 돌아가서 y 교점을 구할 수 있습니다 이 공식을 가지고 y 교점을 구합시다 y 교점 b는 (y의 평균) - (기울기) y 교점 b는 (y의 평균) - (기울기) 방금 구한 기울기가 3/7이죠 방금 구한 기울기가 3/7이죠 기울기에 x의 평균 7/3을 곱해 줍니다 기울기에 x의 평균 7/3을 곱해 줍니다 서로 역수입니다 소거되고 1이 남습니다 y교점은 그냥 2 - 1이네요 따라서 1이죠 직선의 방정식을 구했습니다 회귀직선의 방정식은 m값을 구했습니다 m은 3/7이죠 y = (3/7)x + 1입니다 다 됐습니다 이제 그래프에 나타내 봅시다 y교점은 1이고요 이 점입니다 그리고 직선의 기울기가 3/7이니까 옆으로 7만큼 갈 때마다 3만큼 올라갑니다 다르게 말하면 옆으로 3.5만큼 갈 때마다 1.5만큼 올라가는 거죠 이쪽으로 1.5만큼 움직입니다 따라서 이 직선을 그래프로 나타내면 물론 제 손그림이 정확하지는 않지만 이런 모습이 됩니다 실제로 이 점과 겹치지는 않습니다 이렇게 보이면 안 되겠죠 이런 모양에 더 가깝습니다 이 직선이 각 점에서의 제곱 거리를 최소화시킨다는 것을 증명했습니다 제가 보기엔 깔끔하게 잘 된 것 같네요