If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:8:13

동영상 대본

이 그림들은 여러 변수들간의 관계를 보여주는 여섯 개의 산점도입니다 예를 들어 이 산점도를 보면 가로축은 나이 같은 것을 나타내고 이 세로축은 사고 빈도수를 나타낼 수 있습니다 사고 빈도수를 나타낼 수 있습니다 예시를 들어 본 것입니다 이 측정값들은 통계적 설문에 사용될 수 있습니다 나이가 이만큼이면 20살이라 하면 이게 사고 빈도수가 됩니다 100명당 일어나는 사고 건수요 나이가 21살이라면 이게 빈도수입니다 그래서 통계학자들은 산점도에 이 모든 점을 찍었습니다 이는 이변량자료라고 불립니다 이 이름은 두 개의 변수를 고려하는 것들을 그래프에 점으로 나타내서 변수들 간 서로 어떤 패턴으로 영향을 주는지 알아내고 싶다는 것을 고급스럽게 말하는 것입니다 이 동영상에서 하고자 하는 것은 알맞는 추세선을 찾을 수 있는지 서로 다른 축의 변수들 간에 선형적인 혹은 비선형적인 관계가 있는 것처럼 보이는지 그 변수의 영향이 얼마나 큰지 양의 관계인지 음의 관계인지 알아내는 것입니다 그리고 이상치라는 개념에 대해 생각해볼 것입니다 먼저 관계가 선형적인지 비선형적인지 알아봅시다 먼저 관계가 선형적인지 비선형적인지 알아봅시다 자를 이용해 보겠습니다 이쪽의 자료는 이 자료와 가깝게 지나가는 선을 그릴 수 있을 것 같습니다 모든 점들을 지나갈 수는 없지만 최대한 지나가는 것처럼 그릴 수 있습니다 이것을 수적으로 찾는 정확한 방법이 있지만 지금은 눈대중으로 그리겠습니다 그리고 이것과 같이 자료들을 대략 지나가는 선을 그릴 수 있을 것 같습니다 이것은 꽤 선형적인 관계로 보입니다 따라서 이것은 선형관계라고 하겠습니다 변수 하나가 증가하면 다른 변수가 감소하므로 오른쪽 아래로 기울어진 선이 됩니다 이를 음의 선형 관계라고 합니다 이를 음의 선형 관계라고 합니다 이 관계는 상당히 강해 보입니다 점들이 선으로부터 멀지 않기 때문입니다 이 점은 조금 멀지만 점들이 많이 벗어나있지는 않고 대부분 직선과 가까이 붙어있습니다 따라서 이걸 꽤 강한 음의 선형 관계라고 말할 수 있습니다 따라서 이걸 꽤 강한 음의 선형 관계라고 말할 수 있습니다 상당히 음이고, 강합니다 강한다고 하겠지만 적당히 강한 정도입니다 선형관계를 두 변수는 가지고 있습니다 이 그림을 봅시다 그리고 잠시 동영상을 멈추고 이건 어떨지 생각해 봅시다 확인해 봅시다 다시 자를 써보겠습니다 선을 그려넣을 수 있을 것 같네요 일반적으로 이건 한 변수가 증가하면 다른 변수도 증가합니다, 따라서 이런 선이 자료들 사이를 대략적으로 지나갑니다 그리고 양의 관계로 보입니다 한 변수가 증가하면 다른 변수는 증가한다고 볼 수 있습니다 따라서 이건 양의 관계입니다 하지만 약한 관계입니다 많은 자료들이 선과 떨어져 있습니다 따라서 양의, 약한 관계입니다 하지만 선형이긴 합니다 한 변수가 증가하면 다른 변수도 비슷한 속도로 증가하는 추세를 보입니다 자료들이 흩어져있긴 하지만 말입니다 따라서 이것은 선형입니다 이상치란 무엇인지 볼 필요가 있습니다 이 직선이 자료의 특성을 나타내고 있는데 선으로부터 상당히 떨어진 자료가 바로 이상치입니다 예를들면 양의 약한 선형관계라고 표현하더라도 예를들면 양의 약한 선형관계라고 표현하더라도 이것은 수직축의 변수의 값은 높지만 수평축의 변수의 값은 낮습니다 수평축의 변수의 값은 낮습니다 따라서 이 점은 이상치입니다 직선으로부터 꽤 멀리있습니다 이를 이상치라고 볼 수 있습니다 조금 주관적이긴 합니다 어떤 자료가 다른 것들과 떨어져 있는 이상치일까요? 어떤 자료가 다른 것들과 떨어져 있는 이상치일까요? 이것도 이상치가 될 수 있습니다 이것들을 표시해 둡시다 이상치라고요 이제 동영상 잠시 멈추고 이것에 대해 생각해 보세요 양의 관계인지, 음의 관계인지, 선형인지 비선형인지, 강한지, 약한지 말입니다 자를 다시 꺼내보겠습니다 이렇게 될겁니다 이 그림에는 선이 잘 들어맞습니다 이렇게 보라색 선처럼 선을 맞출 수 있습니다 이것은 양의 관계처럼 보입니다 이 자료들은 한 변수가 증가하면 다른 변수도 증가합니다 이 자료들은 한 변수가 증가하면 다른 변수도 증가합니다 따라서 양의 관계입니다 그리고 꽤 강하다고 할 수 있습니다 점들이 선에 꽤 가깝기 때문입니다 점들을 보면 꽤 두꺼운 직선처럼 보입니다 따라서 양의 강한 선형 관계입니다 그리고 강한 이상치는 없습니다 이게 조금 떨어져 있긴 한데 하지만 모두 선에 가까워보이고 추세를 대략적으로 잘 보여줍니다 이제 이 자료를 봅시다 다시 직선 도구를 이용합시다 직선을 맞출 수 있을 것 같습니다 보시다시피 양의 관계처럼 보입니다 오른쪽 위를 향하는 직선입니다 이렇게 될 것입니다 다시 말하지만 이것은 어림한 직선입니다 컴퓨터나 다른 방법들을 이용해 각각 떨어진 거리를 최소로 하는 정확한 직선을 구할 수 있지만 여기에는 양의 관계는 있지만 약한 선형 관계가 있다고 말할 수 있습니다 약한 선형 관계가 있다고 말할 수 있습니다 많은 점들이 선으로부터 많이 벗어났기 때문에 강하지는 않습니다 따라서, 양의 관계이고 약한 선형 관계가 되겠습니다 그리고 많은 이상치가 있습니다 이 점은 많이 떨어져 있습니다 다음으로 이 그래프를 봅시다 동영상을 멈추고 생각해 보세요 관계가 양인지, 음인지, 강한지, 약한지 선형인지, 비선형인지 말이죠 가장 먼저 해야 할 것은 선형성을 결정하는 것입니다 직선을 그려볼 수 있습니다 하지만 직선을 그리려고 하면 잘 안 맞는 것을 알 수 있습니다 이렇게 선을 그으면 모든 점들이 선으로부터 휘어져 나간다는 것을 알 수 있습니다 보편적으로 한 변수가 증가하면 다른 변수가 감소하는 것을 볼 수 있지만 선형성을 나타내진 않습니다 곡선의 관계가 적용되는 것 같습니다 따라서 더 복잡한 곡선으로 근사해 보겠습니다 이 곡선이 더 잘 맞는 것 같습니다 따라서 이는 비선형이고 음의 관계입니다 한 변수가 증가하면 다른 변수가 감소합니다 따라서 음의 관계입니다 꽤 강한 비선형 관계입니다 상당히 강합니다 상당히 강합니다 다시 한 번 강조하자면, 이건 주관적입니다 음의, 상당히 강한 비선형 관계라 하겠습니다 그리고 이 점은 이상치라고 할 수 있지만 그렇게 멀지도 않고 잘하면 이 점에 가깝게 곡선을 다시 그릴 수도 있을 것 같습니다 지금은 눈대중으로 그리고 있으니까요 마지막 그래프를 봅시다 이것은 음의 선형 관계처럼 보입니다 몇 개의 이상치가 있지만 꽤 강한 음의 선형 관계 같습니다 이 선을 그려보면 자료들과 잘 맞는 것 같습니다 따라서 이것은 음의, 상당히 강한 선형 관계를 나타냅니다 하지만 이 점들은 명확히 이상치입니다 자료들로부터 멀리 분포해있고 다른 뭉친 점들과 멀리 있습니다 눈여겨 볼만한 이상치는 적어도 두 개가 있습니다 눈여겨 볼만한 이상치는 적어도 두 개가 있습니다 이 강의로 수학 용어들에 익숙해지길 바랍니다 그리고 이 방법은 조금 주관적이라는 것을 기억해야 합니다 그리고 이 방법은 조금 주관적이라는 것을 기억해야 합니다 다른 경우보다 더 명확한 경우들이 있는데 많은 경우 그것과의 비교를 통해 강한 선형성인지 이것보다 더 양의 선형 관계인지 알 수 있습니다 이것보다 더 양의 선형 관계인지 알 수 있습니다 여기 보이듯 자료가 더 선에 가깝기 때문입니다 이것은 선형이라기보다 비선형입니다 어떻게 묘사하고 싶은지에 따라 비교를 통해 주관적으로 자료를 묘사할 수 있습니다