If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:8:18

동영상 대본

식당주인이 고객들이 어디서 오는지 알고싶어합니다. 그래서 고객들의 방문거리에 관한 데이터를 수집하기로 했어요 여기 고객들이 제공한 이동거리가 있네요 그는 그래프를그려 거리분포를 알고싶었어요 핵심어는 이동거리의 분포와 중앙값입니다 어떤 그래프를 사용할까요 그가 그려야하는 그래프는 우리가 생각하는 것보다 더 직관적이어야 합니다 수집된정보의 분포를 시각화하고 중앙값을 나타내고요. 어떤 그래프가 두 정보를 모두 나타낼까요 박스와 위스커 구상...입니다 박스와 위스커구상을위해 중앙값을 찾고 양쪽 절반값의 중앙값을 찾을거예요. 중앙값을 계산할 때는 자료를 정렬해야죠 데이터정렬을 위해 가장 작은수는?? 2가 하나있고 또 2가 있네요 모든 2. 그리고3 4 5는? 6은? 6이 있네요 6은 하나고 7이 있네요 1을 빼먹었어요 두 1을 시작으로 하죠 1 1 2 2 3 3 3 4 5 5 6 7 8 9가 있나? 없네요. 10은? 10 11은? 11 12는? 없어요 14, 15가 있고 20, 22 가 있어요 자, 모든 데이터를 정렬한것은 중앙을 찾기 위해서죠 중앙값이요. 데이터가 몇개죠?? 하나, 둘.....열 열하나, 열둘..................열일곱 그래서 가운데 수는 자신보다 큰 수가 8개죠 작은수도 8개 고요. 생각해봐요, 하나, 둘 . 셋, 넷 다섯, 여섯, 일곱, 여덟,,,여기 6이 8개의 값보다 커요, 내가 맞다면요 8개 수 보다 작아야되요, 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여럷,,,정말로 이건 중앙값이예요. 이제 박스와 위스커구상을 위해 중앙값이 필요하고 자료들를 두 세트로 나눠요. 이제 각각의 중앙값을 택하고 중앙값을 제외하고 남은 두 부분을 봅시다. 때로 남겨두기도 하지만 대체로... 중앙값을 빼고 이쪽 저쪽을 분리해요 우선, 작은쪽 절반이요 중앙값은 뭐예요? 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱 여덟, 그래서 두개의 중앙값을 가지게 되요 중앙값은 2와 3이죠 세개의 수들은 이 둘보다 작고 세개의 수들은 그보다 커요 중앙값을 찾을때, 우리는 이 두 가운데 수들을 택해서 평균을 구해요 2와 3의 가운데는 2.5죠 2+3=5, 5 나누기 2는 2.5 그래서 작은쪽 그룹의 중앙값은 2.5 큰쪽 그룹에서 다시 8개의 데이터가 있어요 가운데 두 수는 11과 14예요 이 두 수의 평균을 구하려면 11+14=25 25의 반은 12.5, 12.5는 정확히 11과 14의 절반이예요 이제 우리는 박스와 위스커 구상을 위한.... 모든 정보를 얻었어요 수직선을 그릴께요 네. 수직선이요 여기를 0 이라 하고 22를 여기가 0, 여기가 5, 여기가 10 여기는 15, 여기는 20 25, 계속해서 30, 35 먼저 생각할 것은.....여러 방법이 있다는거죠 박스와 위스커 구상에서 박스를 먼저 생각해봐요 데이터의 중앙의 절반을 나타내죠. 여기 이 데이터를 나타내고 두 파트의 중앙값사이의 데이터가 우리가 박스로 나타내야할 부분이죠 박스를, 여기서 시작해요 2.5 에서... 첫번째 1/4부터 두번째 1/4까지 여기에 2.5 2.5는 0과 5의 가운데 2.5 그리고 여기 12.5 12.5 12.5 이등분하면 10과 15사이에 12.5 12.5가 여기 네번째 1/4에서 세번째 1/4를 분리해요 상자는, 가운데 절반의 자료를 포함해요 그리고 우린 중앙값을 보이길 원해요. 우린 식당주인이 고객이 얼마나 멀리서 오나 조사하는 중이예요......중앙값은 6 여기 표시해요 핑크색 6은 여기에 박스와 위스커 구상에서 위스커는 전체 범위를 보여주죠 해볼께요 새로은 색깔로 할께요, 오렌지색 어때요? 살펴보면 22가 최대값 22가 여기있고 모든 수가 22 아래에 위치하죠 1이 최소죠 1은 여기 1이요 박스와 위스커 구상을 완성했어요 이제 바로 확인할 수 있어요 중앙값이란? 박스의 중앙이죠 가운데 절반값을 보여주고 . 얼마나 흩어져 있나를 보여주죠 전체 범위를 보여주고요 즉 모든 자료의 분산정도 이것은 중앙값과 분산을 파악하는 좋은 방법이예요