If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

점도표, 히스토그램, 상자그림 비교하기

문제를 보고 어떤 그래프가 적합한지 알아보는 방법을 배워 봅시다.

동영상 대본

이번 수업시간에는 서로 다른 방식으로 나타낸 자료들을 보고 어떤 방법으로 나타낸 것이 문제를 해결하는데 도움이 되는지 알아봅시다 첫 번째 예제를 봅시다 통계학자가 Pixar의 영화 14개의 상영시간을 기록하였습니다 점도표로 나타내보면 각각의 점은 영화이며 히스토그램과 상자그림을 그려 상영시간을 나타냈습니다 중앙값을 찾으려면 어떤 그래프를 이용하면 될까요? 중앙값을 찾아봅시다 이 표는 점도표입니다 14개의 영화를 점으로 나타냈습니다 어떤 영화의 상영시간은 81분이고 또 다른 영화는 92분입니다 93분짜리 95분짜리 96분짜리 영화는 두 개입니다 이런식으로 계속 찾아볼 수 있습니다 중앙값을 찾기 위해서 이 도표를 사용하면 쉽습니다 모든 영화의 상영시간을 목록으로 만들어 순서를 매길 수 있기 때문입니다 그러면 쉽게 중앙값을 찾을 수 있습니다 목록을 만들어 보겠습니다 81, 92를 쓰고 그리고 93, 95 96을 두 번 쓰고 그 후 98을 쓰고 그 후 100을 쓰고 이렇게 목록을 만들고 나면 중앙값을 찾을 수 있습니다 점도표는 확실하게 중앙값을 찾는데 이용할 수 있습니다 히스토그램은 어떨까요? 이것이 히스토그램입니다 중앙값을 어떻게 찾을 수 있을까요? 수치를 찾아 목록을 만들어야 합니다 여기 이 영화는 80에서 85사이인데 정확하게 알 수가 없습니다 상영시간은 81분일수도 있고 84분일수도 있습니다 불분명하여 상영시간을 목록으로 만들 수 없습니다 중앙값을 찾을 수도 없습니다 따라서 히스토그램은 사용할 수 없습니다 상자그림은 어떨까요? 히스토그램은 고르지 않겠습니다 상자그림을 가지고 자료를 다 나열하기는 어려워 보입니다 그러나 정확하게 중앙값을 알려줍니다 이 상자안에 있는 중앙의 선이 중앙값을 알려줍니다 만약 이것이 100이고 이것이 99이면 이것은 95, 96, 97, 98, 99 라는 것입니다 명확하게 중앙값이 99라고 알려줍니다 이 방법이 중앙값을 계산하는 가장 쉬운 방법입니다 그래서 상자그림을 고르겠습니다 히스토그램은 중앙값 계산을 할 수 없습니다 몇 개를 더 풀어 봅시다 남씨는 중고차 여러 대를 소유하고 있습니다 차의 주행기록을 기록하였습니다 동일한 자료로 히스토그램과 상자그림을 아래와 같이 그렸습니다 어떤 도표가 20만 킬로미터이상 주행한 차가 몇 대 인지 찾는데 사용할 수 있을까요? 몇 대의 차량이 200000로미터 보다 많이 주행했나요? 히스토그램에서 볼 수 있듯이 200000과 250000사이에는 세 대가 있으며 250000과 300000사이에는 두 대가 있습니다 그러니까 다섯 대가 있습니다 200000과 250000사이에 세 대 250000 과 300000사이에는 두 대가 있습니다 다섯 대의 차량이 200000 이상입니다 이 히스토그램은 유용하네요 상자그림은 어떨까요? 몇 대의 차량이 200000 이상 주행했는지 찾아볼까요? 만약 200000 이상이 있다면 네 번째 사분위수에 있을 것입니다 그러나 사분위수만 보고는 몇 개의 값이 있는지 알 수 없습니다 답을 구할 수가 없습니다 두 번째 질문을 봅시다 어떤 그래프를 이용하면 주행거리의 중앙값이 약 140000 킬로미터임을 알 수 있을까요? 일단 중앙값을 계산하려면 값을 나열해야 합니다 그리고 중앙에 있는 값을 찾으면 됩니다 그런데 이 그래프를 가지고는 자료를나열할 수 없습니다 세 개의 자료가 0과 50000 킬로미터 범위에 있는지 알지만 정확한 값들을 모릅니다 10000, 10000, 10000이 될 수 도 있고 10000, 15000, 40000이 될 수 도 있습니다 값을 모르기 때문에 순서대로 나열할 수가 없습니다 그러니 중앙값을 찾기도 어렵습니다 중앙값은 분명히 이 범위 안에 있을 것입니다 그러나 정확히 어디있는지를 모릅니다 히스토그램은 적합하지 않습니다 상자그림은 중앙값을 바로 보여줍니다 이 상자의 중앙에 있는 선이 중앙값을 말해줍니다 그리고 우리는 중앙값이 140000 킬로미터임을 알 수 있습니다 이것은 100000, 110000 120000, 130000 그리고 140000이 주행거리의 중앙값입니다 따라서 상자그림이 적합합니다