현재 시간:0:00전체 재생 길이:5:26

점도표, 히스토그램, 상자그림 비교하기

동영상 대본

이번 수업시간에는 서로 다른 방식으로 나타낸 자료들을 보고 어떤 방법으로 나타낸 것이 문제를 해결하는데 도움이 되는지 알아봅시다 첫 번째 예제를 봅시다 통계학자가 Pixar의 영화 14개의 상영시간을 기록하였습니다 점도표로 나타내보면 각각의 점은 영화이며 히스토그램과 상자그림을 그려 상영시간을 나타냈습니다 중앙값을 찾으려면 어떤 그래프를 이용하면 될까요? 중앙값을 찾아봅시다 이 표는 점도표입니다 14개의 영화를 점으로 나타냈습니다 어떤 영화의 상영시간은 81분이고 또 다른 영화는 92분입니다 93분짜리 95분짜리 96분짜리 영화는 두 개입니다 이런식으로 계속 찾아볼 수 있습니다 중앙값을 찾기 위해서 이 도표를 사용하면 쉽습니다 모든 영화의 상영시간을 목록으로 만들어 순서를 매길 수 있기 때문입니다 그러면 쉽게 중앙값을 찾을 수 있습니다 목록을 만들어 보겠습니다 81, 92를 쓰고 그리고 93, 95 96을 두 번 쓰고 그 후 98을 쓰고 그 후 100을 쓰고 이렇게 목록을 만들고 나면 중앙값을 찾을 수 있습니다 점도표는 확실하게 중앙값을 찾는데 이용할 수 있습니다 히스토그램은 어떨까요? 이것이 히스토그램입니다 중앙값을 어떻게 찾을 수 있을까요? 수치를 찾아 목록을 만들어야 합니다 여기 이 영화는 80에서 85사이인데 정확하게 알 수가 없습니다 상영시간은 81분일수도 있고 84분일수도 있습니다 불분명하여 상영시간을 목록으로 만들 수 없습니다 중앙값을 찾을 수도 없습니다 따라서 히스토그램은 사용할 수 없습니다 상자그림은 어떨까요? 히스토그램은 고르지 않겠습니다 상자그림을 가지고 자료를 다 나열하기는 어려워 보입니다 그러나 정확하게 중앙값을 알려줍니다 이 상자안에 있는 중앙의 선이 중앙값을 알려줍니다 만약 이것이 100이고 이것이 99이면 이것은 95, 96, 97, 98, 99 라는 것입니다 명확하게 중앙값이 99라고 알려줍니다 이 방법이 중앙값을 계산하는 가장 쉬운 방법입니다 그래서 상자그림을 고르겠습니다 히스토그램은 중앙값 계산을 할 수 없습니다 몇 개를 더 풀어 봅시다 남씨는 중고차 여러 대를 소유하고 있습니다 차의 주행기록을 기록하였습니다 동일한 자료로 히스토그램과 상자그림을 아래와 같이 그렸습니다 어떤 도표가 20만 킬로미터이상 주행한 차가 몇 대 인지 찾는데 사용할 수 있을까요? 몇 대의 차량이 200000로미터 보다 많이 주행했나요? 히스토그램에서 볼 수 있듯이 200000과 250000사이에는 세 대가 있으며 250000과 300000사이에는 두 대가 있습니다 그러니까 다섯 대가 있습니다 200000과 250000사이에 세 대 250000 과 300000사이에는 두 대가 있습니다 다섯 대의 차량이 200000 이상입니다 이 히스토그램은 유용하네요 상자그림은 어떨까요? 몇 대의 차량이 200000 이상 주행했는지 찾아볼까요? 만약 200000 이상이 있다면 네 번째 사분위수에 있을 것입니다 그러나 사분위수만 보고는 몇 개의 값이 있는지 알 수 없습니다 답을 구할 수가 없습니다 두 번째 질문을 봅시다 어떤 그래프를 이용하면 주행거리의 중앙값이 약 140000 킬로미터임을 알 수 있을까요? 일단 중앙값을 계산하려면 값을 나열해야 합니다 그리고 중앙에 있는 값을 찾으면 됩니다 그런데 이 그래프를 가지고는 자료를나열할 수 없습니다 세 개의 자료가 0과 50000 킬로미터 범위에 있는지 알지만 정확한 값들을 모릅니다 10000, 10000, 10000이 될 수 도 있고 10000, 15000, 40000이 될 수 도 있습니다 값을 모르기 때문에 순서대로 나열할 수가 없습니다 그러니 중앙값을 찾기도 어렵습니다 중앙값은 분명히 이 범위 안에 있을 것입니다 그러나 정확히 어디있는지를 모릅니다 히스토그램은 적합하지 않습니다 상자그림은 중앙값을 바로 보여줍니다 이 상자의 중앙에 있는 선이 중앙값을 말해줍니다 그리고 우리는 중앙값이 140000 킬로미터임을 알 수 있습니다 이것은 100000, 110000 120000, 130000 그리고 140000이 주행거리의 중앙값입니다 따라서 상자그림이 적합합니다