If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

자료에 사칙연산을 할 때, 매개변수에 미치는 영향

자료를 어떤 상수로 더하거나, 빼거나, 곱하거나 나누면 집중경향값과 산포도에 어떤 영향을 미치는지에 대해 알아봅시다.

동영상 대본

여기 스프레드시트에 자료가 있습니다 엑셀이나 구글 스프레드시트를 사용해 보세요 엑셀이나 구글 스프레드시트를 사용해 보세요 이 스프레드시트를 사용하여 빠르게 몇 가지 모수들을 계산할 것입니다 이것을 모집단이라 합시다 이것이 학생들로 이루어진 모집단이고 몇 가지의 모수를 계산해 봅시다 이것은 학생들의 나이이고 이제 몇 가지 모수를 계산할 것입니다 따라서 이 스프레드시트를 사용하여 먼저 계산을 해 보고 그 모수들이 값을 변화시켰을 때에 어떻게 바뀌는지 알아볼 것입니다 자료에 값을 더하고 뺐을 때 모든 값들을 동일 값으로 곱해주었을 때 모수들에게 어떠한 영향을 끼칠까요? 먼저 평균을 구하고 그 다음 표준편차를 구해보겠습니다 그 다음은 중앙값을 구하고 사분범위를 구할 것입니다 사분범위를 구할 것입니다 IQR이라 합시다 해 봅시다 먼저 중심경향성을 살펴봅시다 대부분의 경우 평균을 구하는 함수는 AVERAGE라는 이름을 가지고 있습니다 대부분의 경우 평균을 구하는 함수는 AVERAGE라는 이름을 가지고 있습니다 마우스로 이 모든 것들을 선택하거나 시프트를 누르면서 화살표로 모든 것을 선택할 수 있습니다 이것은 자료의 평균입니다 이제 이 모든 자료에 각각 고정된 값을 더해주었을 때 어떻게 변하는지 봅시다 이 모든 값에다가 5를 더해 봅시다 이 모든 값에다가 5를 더해 봅시다 스프레드시트에서 이를 쉽게 하는 법은 이것을 선택하고 5를 더한 후 쭉 아래로 스크롤 해줍니다 각 측정값들을 보면 이전 값에 5를 더해주었다는 것을 알 수 있습니다 새로운 자료 집합이 생겼네요 Data+5라 하겠습니다 이의 평균이 얼마인지 봅시다 이것의 평균은 정확히 5 더 큽니다 이는 다른 수를 빼고 더했어도 똑같을 것입니다 이는 다른 수를 빼고 더했어도 똑같을 것입니다 평균은 더해주고 빼준 값만큼 달라질 것입니다 이는 크게 놀랍지 않을텐데 왜냐하면 평균을 계산할 때 가지고 있는 숫자들을 더한 후 가지고 있는 수의 개수로 나누어주기 때문입니다 모든 숫자들이 5 더 크다면 5를 더하면 됩니다 이 경우 숫자가 총 몇 개죠? 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟 아홉, 열, 열하나, 열두 개입니다 12개의 5를 추가로 더 더해주고 이를 다시 12로 나누어주기 때문에 평균이 5 커집니다 그러면 평균이 곱셈을 하였을 때는 어떻게 변하는지 봅시다 모든 자료를 선택하여 5를 곱하면 어떻게 될까요? 이것을 5로 곱하는 것이죠 이제 모든 측정값은 5배 커졌습니다 평균은 어떻게 되었을까요? 평균 또한 5배 된 것을 확인할 수 있습니다 따라서 중심경향치는 자료에 더하거나 뺀 만큼 평균에도 그렇게 해 주고 자료에 더하거나 뺀 만큼 평균에도 그렇게 해 주고 5를 곱하거나 나누어주면 평균 또한 그렇게 될 것입니다 그리고 평균을 계산하는 법을 살펴보면 이것이 수학적으로 타당하다는 것을 알 수 있습니다 중심경항성을 나타내주는 또 다른 값인 중앙값 또한 동일한 경향성을 보이는지 알아봅시다 중앙값 또한 동일한 경향성을 보이는지 알아봅시다 그럼 여기에 중앙값을 구해봅시다 이 수들을 크기 순으로 배열해 중앙값을 찾는데 그렇게 어려운 작업은 아니지만 컴퓨터는 이를 매우 빨리 할 수 있습니다 이 자료 집합의 중앙값은 이렇습니다 모든 자료에 5를 더해주면 중앙값은 어떻게 될까요? 중심에 있는 숫자는 이 숫자들을 크기순으로 배열하고 다 5를 더해주면 더해주어도 순서는 같을 것입니다 더해주어도 순서는 같을 것입니다 하지만 이제 중심에 있는 값은 5 더 커질 것입니다 따라서 이는 10.5입니다 10.5가 맞네요 다 5로 곱해주면 어떻게 될까요? 역시 순서는 동일할 것입니다 기존의 것에 5를 곱한 것과 동일할 것입니다 5를 곱한 것과 동일하네요 따라서 이 두 중심경향치는 자료에 더하거나 빼고 곱하거나 나눈 값과 똑같이 중심경향치로 옯겨집니다 중심경향치로 옯겨집니다 이제 산포도를 살펴봅시다 이 또한 비슷한 결과를 가지는지 봅시다 표준편차는 STDEV로 구합니다 모표준편차를 구하겠습니다 이것이 모집단 전부라고 가정한 것입니다 분석해 봅시다 분석해 봅시다 이 모든 것들의 표준편차는 이 모든 것들의 표준편차는 2.99입니다 만약 모든 것을 5만큼 편향시킨다면 어떻게 되는지 봅시다 동영상을 멈추고 어떻게 될지 생각해보세요 이것은 산포도를 나타냅니다 제 생각에는 따라서 자료의 값을 모두 같은 양으로 바꾸면 제 생각에는 따라서 자료의 값을 모두 같은 양으로 바꾸면 평균은 바뀌지만 그 외의 것들도 다 같이 옮겨져 평균으로부터의 거리는 불변할 것입니다 따라서 표준편차는 변하지 않을 것입니다 이 경우는 변하지 않을 것 같네요 그리고 예상대로 변하지 않습니다 만약 자료 집합의 값을 옮기는 경우 이 경우는 5만큼 움직였는데 혹은 -1만큼 움직여주면 산포도, 이 경우 표준편차는 변하지 않습니다 산포도, 이 경우 표준편차는 변하지 않습니다 최소한 표준편차는 변하지 않을 것입니다 하지만 값을 곱하거나 나누면 변할 것입니다 간단한 자료 집합을 상상해보면 평균으로부터 특정 거리에 있는 것들이 평균으로부터의 거리가 5배 더 멀어질 것이기 때문입니다 평균으로부터의 거리가 5배 더 멀어질 것이기 때문입니다 따라서 이는 여기에 5를 곱한 값일 것 같은데 보면 실제로 그러합니다 5를 곱했을 때 말이죠 따라서 값을 곱하거나 나누는 경우에는 표준편차 또한 비슷하게 행동합니다 따라서 값을 곱하거나 나누는 경우에는 표준편차 또한 비슷하게 행동합니다 그러면 사분위수 범위의 경우는 어떠할까요? 이는 곧 제1사분위수 범위에서 제3사분위수 범위를 빼주어 중간 50%의 범위를 알아내는 것입니다 해 봅시다 quartile 함수를 사용해 자료를 선택합니다 제3사분위수를 선택합니다 이것은 제3사분위수를 구해줄 것입니다 거기서 다시 quartile 함수에 같은 자료 집합을 선택합니다 다시 선택해주고 동일한 자료 집합에 대한 제1사분위수를 구해 빼 줍니다 동일한 자료 집합에 대한 제1사분위수를 구해 빼 줍니다 그러면 사분위수 범위가 나옵니다 이것은 자료 집합의 제3사분위수를 구하고 이것은 자료 집합의 제1사분위수를 구합니다 값은 2.75가 나옵니다 이제 이 사분위수 범위가 바뀔지 생각해 봅시다 이제 이 사분위수 범위가 바뀔지 생각해 봅시다 변하지 않을 것 같습니다 왜냐하면 모든 것들이 같은 양으로 옮겨지기 때문에 제1사분위수가 5만큼 더 이동하여도 제3사분위수 범위 또한 5만큼 더 이동하여 그 차이는 변하지 않을 것입니다 역시나 범위 즉 둘 사이의 거리는 바뀌지 않습니다 하지만 동일하게 어떤 값을 곱하면 제1사분위수 범위에 5를 곱하고 제3사분위수 범위도 5를 곱하면 그 차이 또한 5배가 될 것입니다 여기서 확인할 수 있죠 여기서 중요한 점은 여기서는 모든 값들을 5만큼 이동시키고 5만큼 곱해주는 경우를 보았는데 어떤 값을 뺴거나 곱해주어도 상관없습니다 어떤 값을 뺴거나 곱해주어도 상관없습니다 중심경항치인 평균과 중앙값은 자료를 옮기거나 확대하면 그대로 같이 움직입니다 하지만 산포도의 척도인 표준편차와 사분범위는 자료에 값을 더하거나 빼면 바뀌지 않지만 곱하거나 나누는 경우엔 그 값만큼 같이 변합니다