If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:11:57

이산확률변수 및 연속확률변수

동영상 대본

- 우리는 앞에서 확률 변수에 대해 배웠습니다. 이 강의에서 보고자 하는 것은 2개의 변수로 이루어진 확률 변수 입니다. 확률 변수는, 이산 확률 변수와 연속 확률 변수로 이루어집니다. 이산 확률 변수란 기본적인 확률 변수로서 구별되는 (끊어진, 나뉘어진, 연속되지 않는) 값을 가집니다. 곧 예시를 보여드릴게요. 자 영어 단어 discrete (별개의, 구별되는) 의 그대로 이해하면 됩니다. discrete 는 구별된, 분리된 값 을 의미하는데요, 반대로 continuous (연속적인)... 아, 다른 정의를 보여드릴게요. 영단어 discrete 은 너무 뻔하고 부적절한 단어는 아닌데, 좀 미묘합니다. 이건 우리가 이해하고자 하는 방식이 아니죠 이렇게 일반적인 확률 변수에 대한 정의를 보려는게 아닙니다. 자, 구별되는 값을 갖는다고 했는데요, 연속 확률 변수는 범위 내의 어떤 값도 가질 수 있습니다. 그 범위는 무한대가 될 수도 있구요 구간 내의 어떤 값도 될 수 있습니다. 자 이 두가지 방식으로 정의를 해봤는데, 진짜 확률 변수 정의를 살펴봅시다. 여러분이 연속 확률 변수냐 이산 확률 변수를 구분 할 때 함께 이해했으면 좋겠어요. 자, 확률 변수 X를 봅시다. 음.. X 는... 지난 강의에서 다뤘던 방식대로 해볼게요 동전 앞면이면 1 (fair coin, 동전의 각면이 나올 확률이 같은 동전) 뒷면이면 0이라고 할게요. 자 이건 이산 확률 변수 일까요 연속 확률 변수 일까요? 자 이 확률 변수는 구별된 값을 갖게 됩니다. 1을 갖거나, 0을 갖게 되는거죠. 이것을 이해하는 또 다른 방식은 여러분이 서로 다른 (확률 변수의) 값들을 셀 수 있다면 이산 확률 변수 입니다. 이 값이 첫번째 값이고, 이 값이 두번째 값이죠. 그래서 이 확률 변수는 명백하게 이산 확률 변수 입니다. 다른걸 한번 볼까요? 확률 변수 Y를... 뉴올리언스 동물원의 임의의 동물들의 무리 라고 해볼까요? 아, 제가 자란, 뉴올리언스의 아우두본 동물원이라 하죠. Y 는 뉴 올리온스 동물원의 임의의 동물들의 무게(질량, 이후 '무게'로 통일) Y 는 뉴 올리온스 동물원의 임의의 동물들의 무리(질량, 이후 '무게'로 통일) 자, 이건 이산 확률 변수 일까요? 연속 확률 변수 일까요? 음, 보다 정확한 무게를 정의하기 위해 수식어를 추가해야겠군요 자 훨씬 명확하게, 여기에 추가를 할게요. 임의의 동물들의 정확한 무게, 또는 우리 주변의 임의의 물체의 무게 등은 값들의 전체 집합을 가질 수 있습니다. 즉, 누군가 그 특정 순간에, 어떤 물체의 특정 부분의 전자의 정확한 개수를 아주 정확하게 알수 있을까요? 혹은 누군가 어떤 물체의 중성자와 양성자, 어떤 물체의 정확한 몰 수, 혹은 어떤 순간의 동물의 특정 부분을 정확하게 알 수 있을까요? 그래서, 예를 들어, 동물원에서의 무게는 어떤 값도 가질 수 있는데, 음.. 예를들어, 0에 가까운 것은, 물론, 0개의 무게를 갖는 동물은 없죠 하지만 개미 등을 생각한다면 아니면 집먼지 진드기와 같은것을 생각해본다면, 혹은 어떤 동물의 박테리아(박테리아 하나)를 생각해본다면, 0에 가깝다고 볼 수 있죠. 네 물론, 박테리엄은 박테리아의 단수형인건 알고 있어요. 자 이런 방식으로 해보면 동물원에서 가장 육중한 동물은 아마도 코끼리 같은 것이겠죠 몇 킬로그램이나 되는지는 잘 모르겠지만 어쨌든 엄청나게 크겠죠. 뭐 예를들어, 3000 킬로그램이나 뭐.. 더 크다면 5000 킬로 그램이라고 해보죠. 정말 정말 무거운 코끼리의 질량은 모르지만 정말 육중한 음.. 아무튼 코끼리 무게는 잘 모르지만 여러분들이 쉽게 이해하기 위해 재미있게 표현해봅니다. 어떤 동물들도 이 사이의 무게를 갖게 됩니다. 이 무게는 구분되는 값을 갖고 있지 않습니다. 물론 여러분은, 123.75921 킬로그램이라는 동물이 있다고도 할 수 있습니다. 하지만, 그 값마저 아주 정확한 무게는 아닙니다. 좀더 정확히는, 123.759210732 뭐 이렇게.. 자 이해 했을거라 생각하는데, 제가 막 정의한 것이 한정된 구간이라 할지라도, 여러분은 이 구간 사이에서 어떤 값도 가질 수 있습니다. 이것은 이산값이 아니지요. 그래서 이것은 명백하게 연속 확률 분포 입니다. 다른 예시를 한번 볼까요. 음.. 확률 변수 Y 를... 이번에는, 이 교실에서, 임의의 학생이 태어난 연도라고 해 봅시다. 이 교실에서, 임의의 학생이 태어난 연도라고 해 봅시다. 이건 연속 확률 분포일까요 이산 확률 분포일까요? '연도'는 문자 그대로 정의가 가능한데 명확하게 구별되는 연도로 정의됩니다. 연도는 1992도, 1995도, 2001도 가능합니다. `이런 값들이, 이 확률 변수가 실제로 갖는 값들입니다. 예를들어 2000과 2001 사이의 값을 갖는 것은 불가능 합니다. 2000이거나, 2001이거나 2002 이어야 하죠. 여기서 여러분들은, 이 확률 변수가 가질 수 있는 값들을 셀 수 있습니다. 대부분의 경우, 지금까지 우리가 봐온 이런 방식을 통해, 이산 확률 변수는 (아 여길 좀더 명확하게 해볼게요) 이렇게 이산 확률 변수는 대부분의 경우 확률 변수를 다룰때는 유한한 개수의 값을 다루게 됩니다. 물론 유한한 개수만을 갖지는 않습니다. 무한한 개수를 가질수도 있는데 , 예를들어 셀 수 있는 값이라는 것은 문자 그대로 오 그래, 이 값이 첫번째 값이고 이게 두번째, 세번째 ... 이렇게 영원히 셀 수도 있습니다. 말 그대로 리스팅을 할 수 있다면 무한개의 리스트가 될 수도 있는거죠. 다만, 이렇게 셀 수 있는 값을 갖는 리스트라면 여러분은 이산 확률 변수를 다루고 있는 것입니다. 다시 동물원 이야기로 돌아가본다면 여러분은 모든 가능한 질량을 리스팅할 수 없습니다. 일일이 셀 수도 없구요. 뭐... 한번쯤 재미를 위해서 가질 수 있는 모든 값들을 나열해보는 리스팅을 해보셔도 되긴 하지만 오... 그래.. 이러면 되지 라고 생각하면서 0.01, 0.02 이렇게 할수도 있는데 앗, 이미 여러분은 그 사이의 수많은 값들을 건너 뛰어버렸네요 0.011이나, 0.012같은 값들을 말이죠 0.011이나, 0.012같은 값들을 말이죠. 그리고 그 값들 사이에는 또 무한개의 숫자들이 있겠죠 이렇게 연속 확률 변수가 가질 수 있는 모든 값들을 다 셀 수는 없습니다. 일일이 리스트 하는 방법도 없구요 이산 확률 변수만이, 그 값들의 개수를 셀 수 있습니다. 리스팅 할 수도 있구요. 자, 또 다른 예를 들어볼게요. 확률 변수를.. 대문자 Z 라 하죠. Z는 이 우주에서 내일 태어날 개미의 수 라고 해봅시다. 아마 이렇게 생각할 수도 있겠죠. "다른 행성에 개미가 어딨어?" 뭐 그럼 대충 개미 비슷한 생물체라고 해두죠. 우리가 정의한 개미는 아니지만, 혹시 모르죠? (어딘가 있을지?) 그렇게 되면 이 우주에서 태어난 개미의 수는, 뭐 어떤 개미들은 행성간 여행을 하고있을수도 있고.. 뭐 그렇다고 할까요? 어쨌든 내일 이 우주에 태어나는 개미들의 수를 확률 변수 Z 라고 합시다. 이건 연속 확률 변수 일까요 이산 확률 변수 일까요? 자 다시 말하지만, 확률 변수가 가능한 값들을 셀 수 있는데, 1마리 2마리 세마리 네마리 5000조 마리 5000조 +1 마리... 이렇게 셀 수 있죠? 이 값들은 이산적입니다. 바로 이 부분은 이산 확률 변수를 의미합니다. 재밌죠? 좀더 해볼께요 자 확률 변수 X가 있다고 해볼게요. 오, 앞에서 정의한 이걸쓰진 않을거고, 새롭게 확률 변수 X를 정의해보자면... X 는 우승 기록이라 하죠. 자 이렇게 적어볼게요. 2016년 올림픽 남자 100m 달리기의 정확한 우승 기록 2016년 올림픽 남자 100m 달리기의 정확한 우승 기록 그러면 우승자의 기록을.... 뭐 그건 아마 우사인 볼트가 되거나, 아닐지도 모르지만 우사인 볼트도 늙어갈테니까요 아무튼, 2016년 올림픽의 남자 100m 우승 기록은 단순히 시계에 찍힌 기록을 말하는 것이 아니라, '정확한', 아주 정확한 시간 100m 달리기 시의 바로 그 미세하고 정확한 시간을 의미합니다. 이건 이산 확률 변수일까요 연속 확률 변수일까요? 네, 제가 정의했던바에 의하면, 이건 좀 어려웠을텐데 아마 여러분들은 '오, 셀 수 있네' 라고 생각했을 겁니다. 예를들어, 956, 9.56초, 9.57초, 9.58초... 이렇게 말이죠 여러분들이 이렇게 생각하게 된 것은 올림픽 100m 경기의 시계를 보았기 때문인데 그 시계는 거의 1/100 초까지 측정할 수 있습니다. 그 시계는 '약 1/100초' 까지 반올림 한다는 것인데 그것이 그 시계의 정확성을 의미합니다. 하지만, 제가 말한것은 '정확한' 우승 시간을 말한 것입니다. 아주 정확한 시간, 주자가 출발했을 때부터 도착했을 때 까지의 시간. 그 시간은, 어떤 값도 가능합니다. 우슨 시간은 어떤 값도 가능한데 음... 제가볼땐 빛보다 빠를 순 없으니 뭐, 그냥 상상할 수 있는 모든 값이 가능하다고 해보죠 보통 5~12초 정도 사이의 어떤 값도 가능합니다. 9.57초를 의미하는 것이 아니죠. 그건 그냥 시계가 표현해주는 것일 뿐입니다. 실제로 우승시간은 9.571초 일 수도 있고, 9.572359초 일 수도 있지요. 이제 제가 말하는 것을 이해하시리라 생각합니다. 매우 정확한 시간은 특정 구간내의 어떤 값도 가능합니다. 앞에서 말했듯 이것은 연속 확률 변수 이구요. 자 그럼 이렇게 해보면 어떨까요 우승 기록 대신에... 확률 변수 X를 2016년 올림픽 남자 100m 달리기 경주에서 1/100 초 단위의 기록이라고 한다면? 1/100 초 단위의 기록이라고 한다면? 이건 연속 확률 변수일까요 이산 확률 변수 일까요? 아 요건 지울께요 확률 변수의 정의를 바꾸었으니까요. 이건 이산 확률 변수 일까요? 연속 확률 변수일까요? 자 이제는, 확률 변수로 가능한 각 값들을 셀 수 있습니다. 9.56초 9.57초 9.58초 나열이 가능하죠. 이렇게 1/100초 단위에서 반올림한 경우에는 값들을 나열 할 수 있습니다. 이 때는 연속 확률 변수로 다룰 수 있는 거죠. 자 이제 가보셔도 좋습니다. 이 강의가 여러분들에게 이산 확률 변수와 연속 확률 변수를 구분하는 감을 주었기를 바랍니다.