If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

중심극한정리

중심극한정리와 평균의 표본분포란? 만든 이: 살만 칸 선생님

동영상 대본

이 비디오에서 저는 통계학에서 아마 모든 수학을 통틀어서 가장 기본적이고 깊은 주제를 다룰 것입니다. 그것은 중심극한정리에요. 그리고 이것은 뚜렷한 일체의 분포 그리고 변화량--그리고 만약 특정한 변화량이면, 특정한 표준편차가 존재한다는 것을 말해줍니다. 그리고 이것은 연속적 분포 또는 이산형이 될 수 있습니다. 그저 생각하기 쉽게 이산형을 그리겠습니다. 적어도 이 영상의 목적을 위해서. 이제 이산확률분포함수가 있습니다. 그리고 이것을 정규분포와 헷갈리지 않도록 조심하세요. 왜냐하면 당신에게 중심극한정리의 힘을 보여주기 위함입니다. 이제 분포가 있습니다. 이것이 1에서 6까지의 값을 가진다고 합시다. 1, 2, 3, 4, 5, 6. 이것은 일종의 정상이 아닌 주사위죠. 이것은 1을 얻을 가능성이 매우 높습니다. 이것을 불가능하다고 합시다--자, 일직선이 되도록 합시다. 당신은 1을 얻을 가능성이 매우 높습니다. 2를 얻는 것이 불가능하다고 가정합시다. 3과 4를 얻을 가능성이 있다고 합시다. 5를 얻는 것은 불가능하다고 가정합시다. 그리고 다음과 같이 6을 얻을 가능성이 매우 높다 가정합시다. 이제 이것이 저의 확률분포함수입니다. 만약 내가 어떤 평균을--대칭이 되도록 그린다면, 그래서 아마 그 평균은 다음과 같을 것입니다. 평균은 중간입니다. 그래서 그것이 바로 그곳의 평균입니다. 이 표준편차는 아마도-- 이것은 아마 평균을 사이에 두고 저쪽 그리고 저쪽일 것입니다. 하지만 그것은 내 이산분포확률함수입니다. 지금부터 그냥 이 확률분포함수에 묘사되어 있는 확률랜덤 변수의 샘플을 뽑는 것 대신에 나는 이것의 샘플을 뽑으려 한다. 하지만 나는 샘플을 평균화할 것이고 그것들의 샘플을 살피고 얻어지는 빈도평균을 봅시다. 평균이라고 하는것은, 평균을 뜻합니다. 뭔가를 정의해보겠습니다. 샘플의 크기가----나는 여기에 어떤 값이든 넣을 수 있습니다. 우선 n의 샘플 크기를 4로 놓는 것을 시도해봅시다. 그리고 이것이 뜻하는 것은 네개의 샘플을 그래서 처음에 선택했던 네 개의 샘플들을 -- 샘플 크기들은 네 개입니다. 내가 1을 가졌다고 합시다. 또다른 1을 가졌다고 합시다. 그리고 3을 가졌다고 합시다. 그리고 6을 가졌습니다. 그러므로 저것들은 샘플크기 4인 저의 첫 표본입니다. 전문용어들이 헷갈린다는 것을 압니다. 왜냐하면 이 샘플들은 표본 네 개로 이루어져있기 때문이에요. 하지만 우리가 표본 평균과 표본 평균의 표본 분포에 대해서 말할 때, 다음 몇개의 비디오에서 말할 예정인, 일반적으로 당신의 분포에서부터 나온 샘플의 집합이 표본을 나타냅니다. 그리고 표본의 크기는 분포에서 얼만큼 추출했느냐를 의미합니다. 하지만 용어가 많이 헷갈릴 수 있습니다. 왜냐하면 당신은 이것들 중 하나를 하나의 표본으로 착각할 가능성이 있기 때문입니다. 하지만 우리는 여기서 네 개의 샘플을 추출합니다. 우리는 네 개의 샘플 사이즈가 있습니다. 그리고 나는 그것들의 평균을 낼 것입니다. 평균(수학적 의미의)으로 정정합시다-- 평균이라고 할 때 조심하고 싶습니다. 크기가 4인 첫번째 표본의 크기는 무엇일까요? 1+1=2. 2+3=5. 5+6=11. 11 나누기 4는 2.75. 이것이 크기가 4인 첫번째 표본의 첫번째 표본 평균입니다. 이제 다른 것을 합시다. 크기가 4인 제 두번째 표본은, 제가 3, 4, 또 다른 3, 그리고 1을 추출했다고 합시다. 이때 6을 얻을 가능성은 일어나지 않습니다. 그리고 2 또는 5를 얻지 못한다는 점에 주목하세요. 이것은 이 분포에 대하여 불가능합니다. 2 또는 5를 얻을 기회는 0입니다. 그래서 저는 2 또는 5를 가질 수 없습니다. 그렇기 때문에 크기가 4인 표본의 두번째 샘플에 대해서, 내 두번째 표본 평균은 3+4=7입니다. 7+3=10이고 10+1=11. 11 나누기 4는, 다시 한 번, 2.75이다. 한 가지를 더 합시다. 왜냐하면 저는 여기서 하는 것을 분명하게 하고 싶습니다. 그래서 한 가지 더 합시다. 사실 우리는 엄청난 것을 더 할 것입니다. 하지만 하나만 더 구체적으로 합시다. 그래서 크기가 4인 세번째 표폰을--- 그래서 저는 말 그대로 네개의 샘플을 추출할 것입니다. 그래서 제 표본은 원래의 비정상적인 분포의 네개의 샘플로 이루어져 있습니다. 제가 1, 1, 그리고 6과 6을 추출했다고 합시다. 그래서 제 세번째 표본 평균은 1+1=2. 2+6=8. 8+6=14. 14 나누기 3은 3.5입니다. 그리고 내가 찾는 이 표본평균-- 그래서 표본의 크기가 4인 각각의 표본에 대해서 평균을 계산합니다 각각에 대해서 한 뒤에, 도수분포에 그려넣을 것입니다 그리고 이 모든것은 곳 당신을 놀라게 할 것입니다 나는 이 모든 것들을 도수분포에 넣을 겁니다 첫번째 표본평균은 2.75였습니다 그래서 나는 각각의 평균에서 얻은 표본평균의 실제 빈도수를 그려넣을 것입니다 내가 한 번 얻었던 2.75 그래서 작은 그래프를 그릴 것입니다 그래서 저렇게 그렸습니다 그 다음에, 2.75도 얻었습니다 저게 2.75 입니다 그래서 나는 두 번 얻었습니다 그래서 나는 빈도수를 바로 저기에 그릴 것입니다 다음에 3,5를 얻었었습니다 그래서 내가 가질 수 있는 가능한 모든 값들은 3, 3.25, 3.5이다. 그러면 나는 3.5를 가지고, 나는 바로 저기에 그래프를 그릴 것입니다. 내가 지금 하려고 하는 것은 이 견본들을 계속해서 뽑아내는 것입니다 아마 나는 저중에서 10000개를 뽑을 것입니다 그래서 표본들을 계속해서 뽑아낼 것입니다 나는 10000까지 다 왔습니다 나는 그저 이들을 다룹니다 시간이 지남에 따라 어떻게 생겼는지는 각각 다음과 같습니다 나는 한 점을 그릴 것입니다 왜냐하면 축소할 것이기 때문입니다 그래서 만약 내가 이것을 시간이 지남에 따라 이렇게 본다면-- 아직 뽑을 수 있을지도 모르는 모든 값을, 2.75 가 여기 있을 것이다