If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

회귀직선의 제곱 오차

각 측정점으로부터의 제곱 오차를 최소화할 수 있는 직선 구하는 방법을 알아봅시다. 만든 이: 살만 칸 선생님

동영상 대본

다음 몇 개 동영상에서는 꽤 간단한 공식을 배워볼 것입니다 다음 몇 개 동영상에서는 꽤 간단한 공식을 배워볼 것입니다 다음 몇 개 동영상에서는 꽤 간단한 공식을 배워볼 것입니다 대부분의 통계 수업에서는 결과만 배울텐데 대부분의 통계 수업에서는 결과만 배울텐데 대부분의 통계 수업에서는 결과만 배울텐데 저는 그 결과가 어떻게 나오는지 보여드리고 싶습니다 지금 경고해야겠군요 복잡한 수학 계산 그 중에서도 복잡한 대수학이 많을 겁니다 끝부분에서는 미적분도 조금 사용해야 하고요 편도함수도 필요할 겁니다 만약 위의 어느 하나라도 여러분을 주눅 들게 하거나 여러분의 의욕을 꺾을 것 같으면 동영상을 다 볼 필요 없습니다 끝부분으로 건너뛰어서 유도해낸 공식만 보아도 됩니다 끝부분으로 건너뛰어서 유도해낸 공식만 보아도 됩니다 하지만 적어도 저는 실제로 공식을 유도하는 것이 하지만 적어도 저는 실제로 공식을 유도하는 것이 더 만족스럽다고 느낍니다 여기서 생각해볼 것은 좌표평면에 n개의 점이 있다고 칩시다 모두 제1사분면에 있을 필요는 없지만 보기 쉽게 하기 위해서 모두 제1사분면에 그리겠습니다 이 점이 여기 있다고 칩시다 서로 다른 색깔로 칠하고요 서로 다른 색깔로 칠하고요 이 점의 좌표는 (x₁, y₁)입니다 또 다른 점이 여기 있다고 칩시다 또 다른 점이 여기 있다고 칩시다 그 점의 좌표는 (x₂, y₂)입니다 점을 더 그릴 수 있습니다 점을 더 그릴 수 있습니다 수많은 점들이 있을 것입니다 여기, 여기, 여기도 n 번째 점까지 쭉 갑니다 n 번째 점까지 쭉 갑니다 n 번째 점은 여기쯤 있을 수도 있겠죠 그 좌표를 (x_n, y_n)이라 부르겠습니다 여기 n개의 점들이 있는데 실제로 모든 점을 다 그린 건 아니지만 여기서 하려는 건 이 점들까지의 제곱 거리를 최소화시키는 직선을 찾는 것입니다 생각해 봅시다 그 직선을 머릿속에 그려 보는 겁니다 직선이 하나 있겠죠 이 점들에 근접한 직선을 대충 하나 그려 보겠습니다 여기에 그리겠습니다 이렇게 생겼을 것입니다 최대한 근접하게 그려 볼게요 모양을 좀 바꿔야겠습니다 이렇게 생겼을 수도 있죠 사실 어떻게 생겼는지는 저도 모릅니다 여기서 하려는 것은 각각의 점들로부터 직선까지의 제곱 오차를 최소화하는 것입니다 그것이 무슨 뜻인지 생각해 봅시다 이 직선의 방정식이 y = mx + b라면 대수학 1의 내용인데요 이것이 직선의 기울기이고 이것이 y 교점입니다 여기 좌표는 (0, b)이죠 지금부터 다음 몇 개 동영상에서 배울 것은 m과 b의 값을 구하는 것입니다 이 직선을 정의하는 두 가지를 구하는 것입니다 제곱 오차를 최소화하도록 말입니다 오차가 무엇인지부터 정의해 봅시다 이 각각의 점들로부터 직선까지의 오차는 수직 거리입니다 이 거리를 오차 1이라고 부를 수 있습니다 이 거리를 오차 1이라고 부를 수 있습니다 이 거리는 오차 2가 되고요 이 점과 직선 사이의 수직 거리입니다 이 점과 직선 사이의 수직 거리입니다 또는 이 점의 y 값과 직선의 y 값의 차라고 생각해도 됩니다 그렇게 마지막 점까지의 y 값과 직선의 y 값까지 계산합니다 직선의 y 값까지 계산합니다 여기 있는 오차 1의 값은 생각해 보면 바로 이 y 값입니다 y1에서 이 y 값을 뺀 것입니다 이 y 값은 무엇인가요? 여기 보면 x = x₁입니다 이 점은 mx₁ + b이고요 x₁을 이 직선의 방정식에 대입하면 이 점이 나옵니다 따라서 mx₁ + b가 됩니다 첫 번째 오차의 값입니다 다른 점들도 모두 이렇게 계산할 수 있습니다 이 오차는 y₂ - mx₂ + b가 됩니다 이 오차는 y₂ - mx₂ + b가 됩니다 이 점은 mx₂ + b입니다 이 직선에 x₂를 대입했을 때의 값입니다 n 번째 점까지 계속합니다 이 오차의 값은 y_n - mx_n + b가 됩니다 오차의 값의 합을 구하려면 이 값들을 더하면 되겠죠 하지만 여기서는 직선 위 n개의 점들의 제곱 오차를 최소화하는 것이 목적입니다 이 직선에 대한 제곱 오차를 이 직선에 대한 제곱 오차를 모든 제곱 오차의 합과 같다고 정의하겠습니다 여기 있는 오차, 즉 오차 1의 값은 y₁ - mx₁ + b입니다 그리고 제곱합니다 오차 1을 제곱합니다 오차 2를 제곱합시다 오차 2의 제곱은 y₂ - mx₂ + b이죠 오차 2의 제곱은 y₂ - mx₂ + b이죠 n 개의 점들에 대해 같은 방식으로 계속합니다 n 번째 오차까지 계속합니다 n 번째 오차의 값 y_n - mx_n + b입니다 그걸 제곱합니다 그걸 제곱합니다 이 값이 직선의 제곱 오차입니다 다음 몇 개 동영상에서는 이 직선의 제곱 오차를 최소화시키는 m과 b의 값을 구해보겠습니다 이것이 최적선이 얼마나 적합한지 알아볼 수 있는 최적의 방법이라고 가정할 때 이 점들의 최적선을 구해 볼 겁니다 다음 동영상에서 계속하겠습니다 이런 복잡한 수학 문제가 나올 때는 한 번에 한 가지씩만 배우는 것이 편하기 때문입니다 제가 실수를 할 확률도 줄어들지요