주요 내용
현재 시간:0:00전체 재생 길이:8:18

동영상 대본

이번 수업에서는 데이터를 표현하는 여러 방법에 대해 생각해 봅시다 여기에 한 종류의 데이터가 준비되어 있습니다 학생들의 최근 시험 점수입니다 에이미는 90점, 빌은 95점, 캠은 100점 에프라도 100점 그리고 파라는 80점을 맞았습니다 이것은 데이터를 표현하는 한 가지 방법입니다 데이터는 기록된 정보입니다 이것처럼 양적인 것을 기록한 숫자일 수도 있고 학생들이 시험에 얼마나 만족했는지 기록할 수도 있습니다 매우 만족, 조금 만족, 불만족 이런 기준으로 말이죠 혹은 0부터 5까지의 숫자로 등급을 매길 수도 있습니다 숫자로 사람들의 의견을 나타내는 거지요 실제 시험 점수를 나타내는 여기 숫자들과는 다르게 말이죠 그 외에도 여러 종류의 데이터가 있지만 여기서 다 다루지는 않겠습니다 지금부터는 데이터를 나타내는 여러 방법을 생각해봅시다 이것은 그중 한 가지 방법인 표입니다 이 표에는 이름과 점수가 나타나 있습니다 여기에 이름 열이 있고 점수 열이 있습니다 이렇게 표로 만들 수 있습니다 더 분명히 표처럼 보이죠? 일반적으로 많이 쓰는 데이터 표현 방법입니다 이는 전통적인 관계형 데이터베이스가 데이터를 기록하는 방법이기도 합니다 하지만 다른 방법으로 데이터를 표현할 수도 있습니다 막대그래프 또는 히스토그램이라고 불리는 그래프를 사용해서 말이죠 점수는 수직축에 표시하고 이름은 수평축에 표시합니다 점수를 나타내는 수직축에 눈금을 그려 보겠습니다 10, 20, 30, 40, 50, 60 70, 80, 90, 그리고 100 제일 위는 100이고 그리고 여기는 50입니다 이제 각 학생의 점수를 표시합시다 에이미는 90점을 받았으니 막대가 90까지 올라갑니다 그다음은 빌입니다 빌은 95점이니 90과 100의 중간까지 막대가 올라갑니다 캠은 100점을 맞았네요 손으로 그리다 보니 컴퓨터로 만든 그래프처럼 정확하지는 않습니다 이 막대는 캠의 점수이고요 에프라도 캠과 같은 점수를 얻었죠 이게 에프라의 점수입니다 역시 100점이죠 마지막으로 파라는 80점이니 여기입니다 이 그래프는 또 다른 데이터 표현 방법입니다 시각적으로 나타냈지만 옆에 있는 표와 같은 정보를 담고 있어요 누군가의 이름을 찾아 몇 점인지 알아낼 수 있어요 에이미는 90점, 빌은 95점, 캠은 100점 에프라도 100점 파라는 80점을 받았지요 데이터 일부만 표현할 수 있는 방법들도 있습니다 알고 있는 정보가 적어서 학생들 이름을 모를 때에는 점수를 나열할 수 있습니다 '여기 다섯 명의 시험 점수가 있습니다'라고 교수님이 말씀하시며 점수를 90, 95, 100, 100, 80 이렇게 나열하실 수 있습니다 가지고 있는 데이터가 이 숫자 목록뿐이면 막대그래프, 히스토그램, 그리고 표보다 가진 정보가 적지요 표에서는 점수뿐만 아니라 누가 몇 점을 맞았는지도 알 수 있으니까요 숫자 목록에서는 오직 점수만 알 수 있습니다 지금까지 다룬 데이터 표현 방법들 외에도 다른 여러 가지 방법들이 있습니다 예를 들어 각 점수를 받은 학생의 머릿수로 데이터를 표현할 수 있습니다 이 점그래프에서는 수평축에 학생들의 이름 대신에 점수를 적습니다 그러면 여기는 80, 85, 90, 95, 100 그리고 해당 점수를 받은 학생이 몇 명인지 기록하는 겁니다 80점 받은 사람은 몇 명이죠? 파라 혼자이니 점을 하나만 표시합니다 85점 받은 사람은 없고 90점은 한 명이니, 여기에 점을 찍고요 95점을 받은 사람도 한 명이니 점을 하나 찍고요 100점 맞은 사람은 두 명이니 점을 두 개 찍습니다 두 점을 꼭 다른 색으로 찍을 필요는 없습니다 이 그래프는 또 다른 데이터 표현 방법입니다 수직축은 도수(자료의 개수)를 나타냅니다 이 그래프는 80점은 몇 명인지 90점은 몇 명인지 95점은 몇 명인지 100점은 몇 명인지 알려줍니다 즉, 이 점그래프는 여기 숫자 목록과 같은 데이터를 가지고 있습니다 데이터를 다르게 나타낸 것뿐이죠 가지고 있는 데이터를 여기 있는 표현 방법의 하나로 정리하면 흥미로운 질문들에 답할 수 있습니다 예를 들면 데이터의 범위는 무엇인지 물을 수 있습니다 범위란 최솟값과 최댓값의 차이를 말합니다 따라서 이 데이터의 범위는 제일 높은 점수인 100점과 제일 낮은 점수인 80점의 차이입니다 범위 = 최댓값 - 최솟값 이 경우에는 범위 = 최고 점수 - 최저 점수 100 - 80 = 20 범위는 20입니다 범위는 데이터가 흩어진 정도를 나타냅니다 이번에는 100점 미만인 학생은 몇 명인지 물어볼게요 매우 흥미로운 질문이네요 100점 미만인 학생의 수 이 중에서 어떤 데이터 표현 방법을 사용해도 이 두 질문에 답할 수 있습니다 100점 미만은 몇 명인가요? 한 명, 두 명, 세 명 100점 미만은 몇 명인가요? 100은 여기 위니까. 한 명, 두 명, 세 명 100점 미만은 몇 명인가요? 한 명, 두 명, 세 명 100점 미만은 몇 명인가요? 한 명, 두 명, 세 명 어떤 방법을 사용하든 같은 답인 3이 나옵니다 이번에는 도수가 가장 높은 건 몇 점인지 물어봅시다 이 질문도 여기 있는 아무 방법이나 사용해서 답할 수 있습니다 제일 처음의 표를 보세요 90점에 한 명, 95점에 한 명, 80점도 한 명 100점만 두 명이네요 도수가 가장 높은 점수는 100점이네요 이 막대그래프에서도 같은 답이 나옵니다 100점짜리가 두 개이네요 다른 점수들은 각각 하나밖에 없습니다 이 숫자 목록에서도 100점은 두 개입니다 오른쪽 아래의 점그래프가 도수를 가장 분명히 보여주는데요 점이 가장 많이 찍혔으니 100점이 도수가 가장 높습니다 지금까지 데이터를 읽고 표현하는 방법 몇 가지를 간단히 소개했습니다 여기서 여러분이 명심해야 할 것은 이것들은 모두 다른 방법이지만 똑같은 데이터를 표현하고 있다는 겁니다 어쩌면 우리가 또 다른 방법을 더 만들어 낼 수도 있겠네요