로딩 중

(Part 4)회귀직선의 제곱 오차 최소화 증명

동영상 대본

여기까지 왔다면 이 점들의 제곱 거리를 최소화하는 최적선을 찾는 방법을 기다렸을 것입니다 그럼 요점부터 알아보도록 하죠 m과 b의 최적값을 구해 봅시다 지난 동영상에서 배운 것을 토대로 풀 수 있는 방법이 두 가지가 있습니다 지난 동영상에서 배운 것을 토대로 풀 수 있는 방법이 두 가지가 있습니다 이 직선상의 두 점을 알고 있으니까 그 직선의 기울기를 구해서 y 교점, b를 구할 수 있습니다 또는 이 연립방정식에 대한 답이라고 할 수 있습니다 사실 수학적으로는 같은 말입니다 m을 먼저 구해 봅시다 그러려면 b를 소거해야겠죠 맨 위의 방정식을 여기 쓰인 대로 옮겨 쓸게요 m * x²의 평균 + b * 사실 이것보다 더 나은 방법이 있습니다 한 걸음 더 나아가면 지난 동영상의 내용을 토대로 위의 식에서 밑의 식을 빼는 것이죠 위의 식에서 밑의 식을 빼는 것이죠 뺄셈을 합시다 아니면 음수를 더하던가요 이것을 음수로 바꾸면 이것도 음수가 되고 이것도 음수가 됩니다 무엇이 나오죠? m * (x의 평균 - x²의 평균/x의 평균) 입니다 m * (x의 평균 - x²의 평균/x의 평균) 입니다 m * (x의 평균 - x²의 평균/x의 평균) 입니다 b와 –b는 소거되고요 그러면 y의 평균 – xy의 평균/x의 평균입니다 그러면 y의 평균 – xy의 평균/x의 평균입니다 이걸로 양변을 나눠주면 m = (y의 평균 – xy의 평균/x의 평균)/ (x의 평균 - x²의 평균/x의 평균)입니다 m = (y의 평균 – xy의 평균/x의 평균)/ (x의 평균 - x²의 평균/x의 평균)입니다 m = (y의 평균 – xy의 평균/x의 평균)/ (x의 평균 - x²의 평균/x의 평균)입니다 m = (y의 평균 – xy의 평균/x의 평균)/ (x의 평균 - x²의 평균/x의 평균)입니다 여기 있는 두 점 사이의 기울기를 구해도 똑같은 식이 나온다는 것에 주목하세요 이 y의 값과 저 y의 값의 차는 여기 이 값이고요 x값의 차로 나누어집니다 이 x의 값과 저 x의 값의 차는 여기 이 값입니다 단순화시키기 위해서 분자와 분모에 x의 평균을 곱해줄 수 있습니다 양쪽 분모에서 이것을 없애기 위해서죠 분자에 x의 평균을 곱해주면 x의 평균 * y의 평균에서 이것들은 소거되고 xy의 평균을 뺀 값입니다 xy의 평균을 뺀 값입니다 그 식을 x의 평균 * x의 평균 즉 (x의 평균)² - x²의 평균으로 나눠준 것이 즉 (x의 평균)² - x²의 평균으로 나눠준 것이 m의 값입니다 b의 값을 구하고 싶으면 둘 중 어느 식에 대입해도 되지만 이쪽 식이 더 간단하죠 이쪽에서 b의 값을 구하려면 b에 관해 m을 정리하면 됩니다 양변에서 m * (x의 평균)을 뺍시다 b = y의 평균 – m * (x의 평균)입니다 b = y의 평균 – m * (x의 평균)입니다 그러니까 측정점을 가지고 x의 평균, y의 평균, xy의 평균, x²의 평균을 구하고 m을 구한 뒤에 다시 이 식에 대입해서 b의 값을 구하면 됩니다 이렇게 최적선을 구했습니다 다 됐네요 이렇게 최적선을 구하는 주요 공식 두 개를 배웠습니다 다음 동영상에서는요 지금까지의 내용을 건너뛰셨다면 다음 동영상부터는 처음부터 끝까지 보는게 좋습니다 이 공식들을 활용해서 실제로 최적선을 구하는 법을 배우게 되니까요 적어도 점에서부터의 제곱 거리를 가지고 오차를 재는 경우에는 말이죠 이 공식을 가지고 실제로 특정 자료를 위한 최적선을 구할 겁니다