If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용
현재 시간:0:00전체 재생 길이:6:26

이산확률분포의 분산과 표준편차

동영상 대본

저번 동영상에서는 확률변수 X를 정의했습니다 확률변수 X를 정의했습니다 X는 이산확률변수입니다 X는 유한한 개수의 값만 가질 수 있고 이를 제가 한 주에 하게 될 운동 횟수로 정했습니다 그리고 이 확률변수 X의 기댓값 그리고 이 확률변수 X의 기댓값 혹은 X의 평균이라고도 할 수 있는 값을 구했고 그리스 문자 mu로 나타냈습니다 mu는 모평균을 나타낼 때 사용합니다 저번에 했던 모든 것은 확률에 대한 다양한 결과값들의 가중합입니다 그리고 이 확률분포에서 확률변수의 기댓값 혹은 평균이 2.1이란 것을 알아냈습니다 이제 이 개념을 확장해서 산포도를 측정해 봅시다 우선 이 확률변수의 분산이 얼마인지 생각해 봅시다 그리고 분산에 제곱근을 씌우면 표준편차를 구할 수 있습니다 이 값을 구하는 방법은 저번에 분산을 구했던 방식과 똑같습니다 그래서 확률변수 X의 분산을 구하기 위해서는 각각의 결과값들과 평균의 차이를 구한 다음 그것을 제곱한 것에 확률값을 곱해서 더해주면 됩니다 예를 들어 첫 번째 자료는 (0 - 2.1)²에 0이 나올 확률인 0.1을 곱하고 그 다음 여기다가 (1 - 2.1)²에 1이 나올 확률 0.15를 곱한 걸 더합니다 그 다음에는 (2 - 2.1)²을 2가 나올 확률인 0.4로 곱한 후 더해줍니다 2가 나올 확률인 0.4로 곱한 후 더해 줍니다 그 다음으로 (3 - 2.1)² ・ 0.25를 더하고 (3 - 2.1)² ・ 0.25를 더하고 그리고 마지막으로 (4 - 2.1)² ・ 0.1을 더해 줍니다 (4 - 2.1)² ・ 0.1을 더해 줍니다 자 다시 한 번 각각의 결과값과 평균의 차이값을 제곱한 뒤 각각의 결과값과 평균의 차이값을 제곱한 뒤 제곱한 뒤 여기에 결과의 확률을 곱해 줍니다 이것은 (-2.1)²인데 2.1²과 같으니 이렇게 쓰죠 2.1²과 같으니 이렇게 쓰죠 0.1을 곱하고 이게 첫 번째 항입니다 그리고 여기다가 1 - 2.1 즉, -1.1의 제곱을 구해야 합니다 이건 결국 1.1²인 1.21이 되지만 그렇게 적지 않고 1.1²이라고 적겠습니다 0.15를 곱해 줍니다 그리고 여기는 2 - 2.1인 -0.1이 됩니다 이걸 제곱하면 0.01이 됩니다 -0.1에 -0.1을 곱하면 0.01이고, 여기에 0.4를 곱한 후 0.01이고, 여기에 0.4를 곱한 후 그리고 0.9² 그러니까, 0.81을 0.25와 곱한 후 더합니다 거의 다 왔습니다 이건 1.9²에 0.1을 곱한 것 입니다 다 하면 1.19를 얻습니다 이 식은 결국 1.19가 됩니다 그리고 이 확률변수의 표준편차를 원한다면 그리스 문자 시그마로 표시합니다 확률변수 X의 표준편차는 분산의 제곱근이 됩니다 1.19의 제곱근을 계산기로 계산해 봅시다 그냥 여기에 제곱근을 씌워보면 여기다 1.19를 치면 되겠죠 결과는 약 1.90이 나옵니다 약 1.90이 나옵니다 그리고 이게 맞는지 봅시다 모든 것을 수직선에 놓아보죠 결과값의 항목들은 0, 1, 2, 3, 4가 있고 0, 1, 2, 3, 4가 있고 4가 됩니다 그러니 0을 얻을 확률은 10%입니다 이걸 이렇게 그립시다 이 높이가 10%라고 합시다 1을 얻을 확률은 15%이고 이보다 1/2배 큽니다 그러니 이 정도 높이가 됩니다 2가 나올 확률은 40%입니다 이건 곧 이 정도 높이가 됩니다 40%의 2를 가질 확률이 있고 3이 나올 확률은 25%입니다 이처럼 말이죠 그리고 4가 나올 확률은 10%입니다 이렇게요 이것은 이산확률분포를 시각화 한 것입니다 여기 수직축을 그리진 않았지만 이건 0.1, 이건 0.15 이건 0.25, 이건 0.4입니다 그리고 평균이 2.1이란 것을 압니다 이 평균은 여기 2.에 존재합니다 어느 정도 잘 맞습니다 이 확률변수가 정수값만 가진다고 해도 정수가 아닌 평균값을 가질 수 있습니다 그리고 표준편차는 1.09입니다 평균으로부터 1.09배 위는 3.2에 가깝습니다 그리고 평균의 1.09배 아래는 1과 가깝습니다 그리고 이 결과는 나름 타당합니다 이 평균값은 확률분포의 중심경향성을 나타내는 지표입니다 그리고 표준편차는 산포도를 나타내기에 알맞은 척도입니다 산포도를 나타내기에 알맞은 척도입니다