If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

선형 회귀(직선형)를 통한 예측

선형 회귀를 이용하여 값을 예측해 봅시다.

동영상 대본

리즈의 수학 시험에는 학생들이 시험 공부에 얼마나 많은 시간을 투자했는지에 대한 설문조사가 포함되어 있습니다 이 그림은 학생들이 공부한 시간과 시험 성적의 관계를 나타냅니다 시험 성적의 관계를 나타냅니다 이 관계를 나타내는 직선이 있습니다 이 직선이 얼마나 맞는지는 알 수 없지만 언뜻 보기엔 꽤 맞는 것 같습니다 언뜻 보기엔 꽤 맞는 것 같습니다 어떤 직선의 방정식이 주어진 모델을 잘 표현했나요? 이 점에 대해 말하자면 이 점에 대해 말하자면 30분 좀 넘게 공부했고 시험 성적이 그다지 좋지 않아 보입니다 43 또는 44점인 것 같네요 이 점은 이 점은 두 시간 공부한 학생이 64 또는 65점 정도 받았다는 것을 말합니다 그리고 이 점은 4시간 넘게 공부한 학생은 4시간 넘게 공부한 학생은 95 또는 96점 받았음을 뜻합니다 여기 이 점들은 모두 각각의 다른 학생들을 나타냅니다 그들은 직선에 부합합니다 그러면, 어떤 직선의 방정식이 이 모델을 잘 표현했나요? 즉, 어떤 직선의 방정식이 자료와 잘 맞는 직선을 나타낼까요? 직선을 나타낼까요? 직선의 방정식을 구해야 합니다 직선의 방정식을 구해야 합니다 이 방정식의 y절편은 20입니다 보기의 모든 방정식의 y절편이 20이라서 딱히 도움이 되진 않네요 그러면, 기울기를 살펴봅시다 x값을 1만큼 증가시킬 때 x값을 1만큼 증가시킬 때 x값을 1만큼 증가시킬 때 y값의 변화량은 어떻게 되나요? y값의 변화량은 20에서 40으로 갔죠? 20만큼 올라갔네요 이 모델에 대한 Δy/Δx값 즉, 자료에 부합하는 이 직선의 Δy/Δx값은 20/1입니다 따라서 이 값이 기울기가 됩니다 보기 중에서 이 보기만 기울기가 20입니다 따라서 이 보기가 정답입니다 방정식을 바탕으로 3.8시간동안 공부한 학생의 점수를 계산하세요 3.8은 아마 여기쯤 있을 겁니다 3.8은 아마 여기쯤 있을 겁니다 점수를 계산해 봅시다 위로 쭉 올라가면 모델과 어디서 만나나요? 위로 쭉 올라가면 모델과 어디서 만나나요? 꽤 높은 점수를 받은 것 같군요 수직축의 값을 확인해보면 대략 97정도 되는 것 같습니다 모델을 바탕으로 97점 정도 받은 것 같다고 적겠습니다 다시 말하지만 이건 그저 모델일 뿐입니다 어떤 학생이 3.8시간 공부해서 97점 받았다고 확신할 수는 없지만 공부 시간이 점수에 영향을 미친다고 공부 시간이 점수에 영향을 미친다고 어느 정도 합리적인 예측이 가능합니다 어느 정도 합리적인 예측이 가능합니다 하지만, 주의해야 합니다 9시간을 공부하면 200점을 받게 되는 200점을 받게 되는 말도 안되는 상황이 벌어질 수도 있기 때문이죠 따라서, 모델을 이용한 추정은 항상 조심해야 합니다 곧이곧대로 따라가면 안 돼요 이것은 자료에 부합하려고 하는 모델일 뿐입니다 어떤 값을 측정하거나 예측할 때 유용할 수 있지만 있는 그대로 받아들이면 안 됩니다