주요 내용
현재 시간:0:00전체 재생 길이:8:54

동영상 대본

번역 : Sung Min Yoon 싱크 및 최종수정 : Yoon-Sik Eom <유클리드> 우리는 지금부터 통계의 세계로의 우리의 여행을 시작하려고 합니다. 통계는, 데이터를 이해하거나, 또는 머리를 굴리게하는 방법이지요. 그러니까 통계는 모두 데이터에 관한 것입니다. 그리고, 우리가 이 통계 세계로의 여행을 시작하려고하니, 우리는 '기술통계학'이라고 부르는 것을 할 것입니다. 만약 우리가 많은 데이터를 가지고 있고, 이 모든 데이터를 주지 않고 이 데이터에 대해서 어떠한 것을 얘기하고 싶어 한다면, 우리는 이것을 작은 집합의 수로 묘사할 수 있을까요? 그래서 이것이 우리가 주목해야 할 것입니다. 우리가 기술통계학에 대한 우리의 도구키트를 준비하였다면, 우리는 그 데이터에 관한 추론을 만드는 것을 시작할 수 있고, 결론을 만드는 것을 시작할 수 있고, 판단을 할 수 있으며, 우리는 '추론통계학'과 관련된 많은 것들을 시작할 것입니다. 추론을 만드는 것이지요. 그래서, 이 방법외에, 우리가 어떻게 데이터를 묘사할 수 있을 지 생각해봅시다. 우리가 숫자의 집합을 가지고 있다고 합시다. 우리는 이것을 데이터로 고려합니다. 아마 우리는 우리 정원의 식물들의 높이를 특정하는 것일 수도 있지요. 우리가 6개의 식물을 가지고 있고 그들의 높이는 4 인치, 3인치, 1인치, 6인치 그리고 1인치, 7인치라고 합니다. 다른 방에 있는 한 사람이 당신의 식물을 보지 않은 상태로 물어봅니다. 당신의 식물의 높이는 얼마입니까? 그리고 그들은 당신의 식물들의 각기 다른 높이를 대표할 수 있는 하나의 숫자를 듣고 싶어할 것입니다. 어떻게 할 것인가요? 아마 당신은 어떻게 내가 찾을 수 있지라고 말할 것입니다. 나는 한 특정 숫자를 원하는 것인가? 나는 중간 수치를 대표하는 숫자를 원하는 것일까? 아니면, 가장 빈번한 숫자를 원하는 것인가? 아니면 이 숫자들의 정확히 중간에 있는 숫자를 원하는 것인가? 만약 당신이 이러한 것들 중에 하나를 얘기하였다면, 당신은 실제로 똑같은 것을 하였을 것입니다. 기술통계학을 다루는 사람들이 말하는 것과 같은 것이요. 그들은 말합니다." 글쎄.. 어떻게 우리가 할 수 있을까?" 평균의 아이디어에 대해서 생각해보면서 시작해봅시다. 매일 쓰는 용어인 '평균'은 매우 특정적인 의미를 가지고 있습니다. 사람들이 말하는 평균은 '산술평균'을 말하는데, 짧게 살펴보도록 할 것입니다. 하지만, 통계에서는 평균은 조금 더 광범위합니다. 이것이 실제로 의미하는 바는, '특정한'숫자를 주시오 또는 '중간'숫자를 주시오 또는.... 이 '또는'이 의미하는 것은 바로 집중화 경향의 측정을 찾아 내려는 시도 입니다. 그래서 다시한번, 당신은 많은 숫자들을 가지고 있습니다. 당신은 이것을 특정적이거나, 중간에 있거나, 중심에 있는 하나의 숫자(평균)으로 대표하려고 노력합니다. 그러면 우리가 보듯이, 여러가지 종류의 평균들이 있습니다. 첫번째는 아마도 당신이 가장 친숙한 것일 것입니다. 이것은 사람들이 이번 시험에서의 평균 또는 평균 키에 대해서 얘기할 때 쓰는 평균이고, 이것을 산술평균이라고 합니다. 노란색으로 적도록 하지요. '산술평균' 산술평균이 명사일때, 우리는 이것을 Uh-rith'-me-tik 이라고 발음합니다. 그리고 형용사일때는 Eh'-rith-me'-tik이라고 발음합니다. 이것은 모든 숫자의 합을 나눈것입니다. 그리고 이것은 사람이 만든 정의인데, 우리가 이용하기 편리하다고 찾아낸 정의는 모든 숫자의 합을 우리가 가진 숫자들의 갯수로 나누는 것입니다. 그렇다면 이 자료 집합의 산술평균은 무엇일까요? 그럼 한번 구해봅시다. 4 + 3 + 1 + 6 + 1 + 7 나누기 우리가 가진 데이터 수이겠네요. 그래서 우리는 6개의 데이터 숫자를 가지고 있으니 6으로 나누면 되네요. 우리는 그러면, : 4 +3 = 7 +1 = 8 +6 = 14 +1 = 15 +7 = 22. 한번 더 해보죠. 우리는 7, 8, 14, 15, 22를 가지게 되고 이를 6으로 나누면 되겠네요. 그리고 우리는 이것을 대분수로 쓸 수 있겠네요. 6은 22에 3번 들어가고 나머지는 4이네요. 그러면 3과 4/6, 즉 3과 2/3 이네요. 이것을 소수로 나타내면 6이 반복되네요. 우리는 이것을 많은 방법 중 하나로 쓸 수 있지만, 이것은 대표적인 숫자이기 떄문에, 이는 집중경향을 가지려고 합니다. 다시한번 말하지만, 이것은 인간이 창조해낸 것입니다. 이것은 어떤 사람이 종교적인 자료를 찾아서 말하길 " 이것이 산술평균이 반드시 정의되야 하는 정의이다"라고 하는 것이 아니다. 이것은 계산 만큼 순수한 것이 아닌, Weltlalls의 관찰을 통해 원을 찾는 것과 같습니다. 우리가 유용하다고 생각하는 것은 인간의 건설이지요. '전형적'인 평균을 구하는 다른 많은 방법들도 많습니다. 다른 방법 중 하나는 중간값인데요, 분홍색으로 써 볼께요. 그리고 모든 수의 평균의 중간값이지요. 모든 숫자로 중간값인 평균을 구하면 이 데이터들의 중간값은 무엇일까요? 우리는 1 두개, 3, 4, 6, 그리고 7이 있지요, 중간값이 무엇일까요? 짝수개의 숫자가 있으므로 두개의 중간값이 있다는 것을 알수있죠. 3과 4 입니다. 만일 2개의 중간값이 존재한다면 - 그 두 숫자의 중간 숫자를 씁니다. 예를 들면, 중간값을 찾기 위해서 이 두 숫자의 산술 평균을 구하지요. 3과 4의 평균이 3.5 - 이 경우에는 그래서 중간값이 3.5가 되지요. 그래서 만약 짝수개의 숫자가 있다면, 중간값은 두개의 가운데 숫자의 산술평균이 됩니다. 만일 홀수개의 숫자가 있다면, 더 쉬워집니다. 이번에는 다른 데이터를 드려볼께요. 제가 전에 준비해 두었던 데이터 값들입니다. : 우리의 데이터는 0, 0, 7, 50, 10000, 그리고 1000000 입니다. 미친 양의 데이터지요. 이 경우에는 중간값이 무엇일까요? 우리는 홀수인 5개의 숫자가 있습니다. 홀수개의 숫자가 있으므로 가운데 숫자를 찾기 더욱 쉽습니다. 중간값은 어떤 두 수보다 크고 다른 두 수보다 작은 수여야 하지요. 이것이 정확히 중간에 있습니다. 이 경우에는 중간값이 50이 되겠네요. 세번째로 할 것은 가장 적게 쓰이는 것 : 최빈값 입니다. 매우 복잡하게 들리지만, 가장 기본적인 아이디어라는 것을 알 수 있습니다. : 최빈값은 데이터들 중에 가장 자주 나오는 값입니다. 만일 모든 숫자가 단 한번씩만 나온다면 최빈값은 존재하지 않죠. 그러면 데이터 중에 최빈값은 무엇일까요? 우리는 4, 3, 1 두개 6, 7 이 있습니다. 가장 자주 나오는 숫자는 1입니다. 그래서 우리의 최빈값은 1이지요. 데이터들의 대표값을 찾을 때 여러 방법들이 있다는 것을 알 수 있습니다. 그리고 통계학을 공부할 때 여러 방법을 알수록 도움이 됩니다. 산술평균이 가장 많이 사용되고요. 중간값은 미친 숫자들이 많을 때 유용하고요. 최빈값은 가장 많이 나온 값을 찾을 때 유용합니다. 다음 영상에서는 더욱 자세한 통계학에 대해 배우게 될 것입니다.