If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:8:11

동영상 대본

이전 동영상에서는 여기 이변량 자료를 가지고 상관계수를 계산해 보았습니다 조금 복습해보면 여기 공식이 조금은 어려워 보이지만 저번 강의에서 이 식은 그저 각 쌍 z-점수를 곱한 값의 평균임을 보였습니다 각 쌍 z-점수를 곱한 값의 평균임을 보였습니다 그리고 만약 r이 1이면 완벽한 양의 상관관계를 가지고 r이 -1이라면 완벽한 음의 상관관계를 가지고 만약 r이 0이라면 상관관계가 없는 것입니다 이 이변량 자료 집합에 대해서는 r이 0.946으로 꽤 강한 양의 상관관계를 가짐을 알 수 있습니다 이번 동영상에서는 더 나아가 직접 이 점들을 잘 표현하는 최소제곱선의 식을 구하는 것입니다 최소제곱선의 식을 구하는 것입니다 시작하기 전에 이 측정값들에 대한 몇 가지 통계량을 시각화 해 봅시다 이 측정값들에 대한 몇 가지 통계량을 시각화 해 봅시다 네 개의 측정값들이 찍혀있습니다 X의 통계량을 그려 봅시다 X의 표본평균과 표본표준편차를 빨간색으로 써놓고 이렇게 빨간색 사각형을 그려서 잘 보이게 합시다 x의 표본평균은 간단합니다 (1 + 2 + 2 + 3)/4 즉 8/4로 2와 같습니다 x = 2는 여기 있고요 이게 평균으로부터 표본표준편차 하나 위이고 이게 평균으로부터 표본표준편차 하나 밑입니다 y에 대해서도 똑같이 해 보겠습니다 y에 대해서도 똑같이 해 보겠습니다 평균은 3이고 여기가 평균으로부터 y의 표본표준편차 하나 위 여기가 평균으로부터 y의 표본표준편차 하나 밑입니다 이 평균들을 시각화하면 특히 교점과 표준편차들을 시각화하면 최소제곱선에 대한 직감을 늘릴 수 있을 것입니다 일반적으로, 직선의 방정식은 y = mx + b로 표현됩니다 이게 기울기이고 이게 y 절편입니다 회귀직선을 나타낼 때는 작은 모자를 씌워 줍니다 영어로는 말 그대로 y hat이라고 부릅니다 이 표시는 이게 이 값들을 나타내는 회귀직선이라는 뜻입니다 이 표시는 이게 이 값들을 나타내는 회귀직선이라는 뜻입니다 먼저, 기울기를 정해 봅시다 기울기는 r에 x 방향의 표본표준편차를 y 방향의 표본표준편차를 곱한 값입니다 x 방향의 표본표준편차를 y 방향의 표본표준편차를 곱한 값입니다 처음에는 직감적이지 않지만 잠시 후에 설명을 듣고 나면 더 잘 이해될 것입니다 다음으로 알아내야 할 것은 기울기는 구할 수 있지만 y 절편은 어떻게 구하는가입니다 대수학1에서도 배웠듯이 y절편은 기울기를 이미 알고 직선 위의 한 점을 알 때 구할 수 있습니다 최소제곱회귀직선은 항상 점 (x의 표본평균, y의 표본평균)을 지나갑니다 항상 점 (x의 표본평균, y의 표본평균)을 지나갑니다 직선은 무조건 그 점을 지납니다 이 문제를 계산하기 전에 이전 영상에서 r을 계산한 결과는 대략 0.946이었습니다 이제 뭘 해야 할지 생각해 봅시다 최소제곱선은 항상 이 점을 지날 것입니다 최소제곱선은 항상 이 점을 지날 것입니다 r이 1이라면, 완벽한 양의 상관관계를 가졌다면 이 기울기는 y의 표준편차/x의 표준편차일 것입니다 이 기울기는 y의 표준편차/x의 표준편차일 것입니다 이 점에서 시작해서 x의 표준편차만큼 오른쪽으로 이동하고 y의 표준편차만큼 올라가면 완벽한 양의 상관관계를 가졌다면 직선은 이렇게 생겼을 것입니다 꽤 말이 됩니다 y의 산포도를 x의 산포도로 나눴으므로 r이 1이면 이게 기울기가 됩니다 y의 표준편차/x의 표준편차 말이죠 처음 기울기에 대해 배웠던 것처럼 말입니다 y의 변화량을 x의 변화량으로 나누면 혹은 y의 평균 산포도를 x의 평균 산포도로 나누면 말이죠 혹은 y의 평균 산포도를 x의 평균 산포도로 나누면 말이죠 이는 r이 1일 때를 말합니다 적어 놓겠습니다 r이 1일 경우입니다 r이 -1일 때에는 어떻게 될까요? 아마 이런 식일 겁니다 완벽한 음의 상관관계를 가졌을 때 직선의 모습입니다 r이 0이라면 어떨까요? 기울기가 0이되고, 직선은 단순히 이 직선 y는 y의 평균이 됩니다 이 선을 그대로 따라갑니다 이 경우를 생각해 봅시다 r이 0.946이므로 1에 상당히 가까워 강한 상관관계를 띱니다 0.946을 이 비율에 곱하면 x축과 평행한 방향으로 x의 표준편차만큼 움직인다면 y축으로는 얼마나 가야할까요? r 𝗑 y의 표준편차만큼 움직여야합니다 앞에서 다뤘듯이 r이 1이면 완벽한 상관관계의 직선이 되겠지만 이 경우 0.946이므로, 대략 95%정도만 올라갈 것입니다 따라서 구하는 직선은 식을 볼 필요도 없이 이렇게 생길 것입니다 점들과 잘 맞는 것을 알 수 있습니다 이번 영상에서는 증명은 하지 않겠습니다 하지만 이제 직감적으로 이해할 수 있습니다 이상한 식으로부터 나오는게 아니라는 것을 알 수 있길 바랍니다 이제 이 특정 자료에 대해 계산해 봅시다 이제 이 특정 자료에 대해 계산해 봅시다 m은 r, 0.946에 y의 표본표준편차 0.816을 x의 표본표준편차 2.160로 나눈 값을 곱한 것과 같습니다 이제 계산기를 이용해 계산하면 0.946 * 2.160 / 0.816은 2.50입니다 소수점 둘째 자리까지 쓰면 대략 2.50이 됩니다 대략 2.50이 됩니다 이제 어떻게 y 절편을 구할까요? 이 점을 지난다는 것을 명심합시다 따라서 2.50에 x의 평균을 곱하는데 x의 평균은 2이므로 2를 곱해주고 이게 x의 평균입니다 b를 더해주어야 하는데 이는 y의 평균 즉 3입니다 어떻게 되죠? 3 = 5 + b가 됩니다 b는 양변에 5를 빼면 b = -2가 됩니다 이제 구했습니다 회귀선의 방정식을 구했습니다 칭찬으로 자신을 한 번 토닥여 줍시다 ŷ은 이 방정식이 회귀선의 방정식임을 알려주고 이는 2.50x - 2입니다 이는 2.50x - 2입니다