If you're seeing this message, it means we're having trouble loading external resources on our website.

웹 필터가 올바르게 작동하지 않으면 도메인 *. kastatic.org*.kasandbox.org이 차단되어 있는지 확인하세요.

주요 내용

자료에 맞춰 직선 그리기

캘리포니아 중산층 가구의 소득을 산점도로 만들어 자료에 맞는 직선을 그립니다. 만든 이: 살만 칸 선생님

동영상 대본

이 영상에서 저는 데이터를 선으로 표시하는 방법의 예를 보여줄것입니다 조그만 펜 테블릿을 이용한 제 옛날 영상을 사용하는 대신 바로 엑셀에 해서 여러분이 스스로 하는 방법을 알 수 있게 할것입니다 여러분이 엑셀이나 다른 스프레드시트 프로그램이 있다면 말입니다 우리는 수학에 깊이 들어가지 않을 것입니다 저는 여러분이 데치터를 어떻게 선으로 표현하는지 혹은 데이터 회귀를 하는 것의 개념을 이해하기를 바랍니다 일단 문제를 읽어봅시다 이것은 캘리포니아 소득의 중앙값을 보여줍니다 중앙값은 중간이라는 것을 기억하시고, 캘리포니아 수입의 중간은 --미국 인구 조사국에 의해 1995년부터 2002년까지 조사된 것입니다 산점도를 그리고 방정식을 찾으세요 2010년에는 캘리포니아의 한 가족의 연간 수입의 중앙값이 어느 정도일것이라고 생각합니까? 이 문제의 기울기와 y 절편의 의미는 무엇입니까? 처음 여러분이 해야 할 일은 --이 이미지를 그냥 복사하고 붙여넣었습니다-- 우리는 이 데이터를 스프레드시트가 이해할 수 있는 형태로 만들어야 합니다 여기에 표 몇개를 만들어봅시다 1995년부터라고 합시다 그것을 하나의 세로줄이라고 합시다 이것을 조금만 더 넓게 합시다 그런 다음 소득의 중앙값을 입력합시다 이것이 캘리포니아의 한 가족의 소득의 중앙값입니다 우리는 1년 혹은 0년에서 시작합니다 1995, 0,1, 2, 3, 4이기 때문입니다 여러분이 원한다면 여러분이 아래로 내려갈수록 추세선을 그려줄 것입니다 이것은 여러분이 오직 1만큼 증가하는 것을 보여줄 것입니다 그러면 소득 --그냥 이 숫자들을 복사하겠습니다 53,807달러, 55,217달러, 55,209달러, 55,415달러, 63100달러, 63,206달러, 63,761달러, 그리고 65.766달러가 있습니다 그리고 이것들은 필요가 없습니다 그래서 이것들을 없앨 것입니다 이것들을 지울 수 있습니다 입력 수가 충분한지 확실히 합시다 이것은 1, 2, 3, 4, 5, 6, 7, 8이고 저에게는 1, 2, 3, 4, 5, 6, 7, 8이 있습니다 제가 데이터를 확실히 썼는지 알고싶습니다 55,217달러, 55,209달러, 415, 100, 206, 761, 766 이제 해봅시다 이제 여러분은 엑셀에서 어떤 것을 클릭해야 하는지 안다면 이것이 매우 쉽다는 것을 알게 될 것입니다 첫번째, 데이터를 표시하고, 산점도를 만들고, 이 데이터의 회귀를 만드십시오 여러분이 할 일은 데이터를 선정하는 일 뿐입니다 그런 다음 '삽입'으로 가서 저는 산점도를 삽입할 것입니다 그러면 여러분은 여러가지의 산점도의 종류를 고를 수 있습니다 저는 그냥 데이터를 표시하고 싶습니다 이제 봅시다 이것이 제게 데이터를 표시해주었습니다 한번 봅시다 이것부터가 실제 수입이고 이것은 1995년 부터입니다 이것이 1995입니다 53,807달러였지요 1996년에는 55,217달러입니다 이것은 모든 데이터를 표시했습니다 이제 제가 할 일은 선을 그리는 것입니다 이것은 정확히 말하면 직선은 아닙니다 하지만 직선이 이것을 따라 이어질 수 있다고 추정하면 저는 엑셀이 직선을 그리도록 할 것입니다 제가 할 수 있는 것은 여기 있는 다양한 옵션들을 가지고, 이 모든 것을 가지고 직선을 그리는 것입니다 저는 이것을 고를것입니다 여러분은 이것이 보이지 않을 지도 모릅니다 이것이 점 사이에 직선을 가지고 있는 것처럼 보입니다 이것은 또한 함수를 가지고 있습니다 이것은 직선의 방정식을 나타낼 것입니다 따라서 제가 이것을 클릭하면-- 보십시오 이것은 꼭 맞을 뿐 아니라 같은 데이터를 다른 그래프에 다시 표시했습니다 이것을 조금 더 크게 해봅시다 아니, 이건 아닙니다 이것을 조금 더 크게 만들어봅시다 이제 이 데이터를 가려도 됩니다 내용을 다 알고 있기 때문입니다 그렇다면 이렇게 가려봅시다 따라서 이것은 다양한 측정점을 표시했을 뿐 아니라 이것에 직선을 그려넣었고 제게 직선의 방정식을 주었지요 이것을 조금 더 크게 만들 수 있는지 봅시다 이것을 옮겨서 여러분이 최소한 읽을 수 는 있도록 하겠습니다 이것은 여기에서 이 직선의 방정식은 y=1882.3x + 52,847이라고 되어있습니다 여러분이 우리가 기울기에와 y절편에 대해서 무엇을 알고 있는지 기억한다면 y 절편이 이 직선을 사용했을때 0년, 혹은 1995년에서 만나는 수치인 52,847이라는 것을 알 수 있습니다 따라서 여러분이 이 직선을 견본으로 삼는다면 1995년에는 직선이 52,847 달러를 번다는 것을 말해줍니다 실제 데이터는 이것과 약간의 차이가 있습니다 이것은 조금 더 높은 53,807이었습니다 따라서 이것은 조금 더 높았습니다 하지만 우리는 모든 데이터와 가까운 직선을 그리려 하고 있습니다 이것은 사실 직선의 모든 점들 사이의 거리의 제곱을 최소화하려는 것입니다 우리는 여기서 수학을 사용하지 않을 것입니다 하지만 이것은 우리에게 좋은 방정식을 주었습니다 우리는 이제 이 방정식을 가지고 예상할 수 있습니다 이것이 데이터를 위한 좋은 표본이라고 하면 --이것을 조금만 내려봅시다-- 이 문제에 대답해봅시다 우리는 산점도를 그렸습니다-- 사실은 엑셀이 했지만 말입니다 우리는 여기 있는 방정식을 찾았습니다 그들은 2010년에 캘리포니아 의 한 가족의 연간 수입이 어떻게 될 것이라고 예측하는지 물었습니다 여기서 우리는 그냥 제시된 방정식을 사용하면 됩니다 여기가 2002년입니다 제가 연도를 써보겠습니다 이것이 2002년이었습니다 따라서 2010년은 8년을 더 가야 합니다 여기에 작은 세로열을 만들어봅시다 이것은 1995년, 1996년입니다 엑셀은 제가 이것들을 선택하면 알아낼것이고 밑에 있는 이 작은 정사각형으로 가서 스크롤를 내리면 엑셀은 제가 매번 1년씩 증가하는 추이를 보고 싶다는 것을 알아낼 것입니다 1995년부터라고 한다면 또한번 저는 이 추세를 알 수 있습니다 따라서 2010년은 15년이 될 것입니다 우리는 그냥 이 방정식을 적용할 수 있습니다 우리는 이것이 이 직선에 따르면 --저는 지금 그냥 입력하는 것입니다 여러분이 이해할 수 있기를 바랍니다-- 1882.3x라는 것을 알 수 있습니다 여기의 x는 1995년부터 시작하므로 저는 그냥 이 줄을 선택하거나 숫자 15를 입력하면 됩니다 이것은 이 줄을 곱하는 것, 즉 곱하기 15라는 것을 의미합니다 그리고 더하기 52,847, 저기 있는 것을 더합니다 엔터 키를 누르면 이것은 81,081.50달러를 예측해줍니다 따라서 여러분이 이 직선을 또 8년정도 계속해서 따라가면 이것은 캘리포니아의 한 가족의 수입의 중앙값이 81,000달러가 될 것이라는 것을 예측해줍니다 어쨌든, 여러분이 이것이 흥미롭다고 느꼈기를 바랍니다 스프레드시트들은 데이터를 다루는 데 매우 유용한 도구입니다 이것은 여러분에게 왜 직선형 표본, 직선이 왜 흥미로운지 알려줄 것입니다 또 당신이 어떻게 실제로 어떻게 이 도구들을 사용해서 데이터를 분석하고 또 몇몇의 종류의 추윽을 할 수 있는지 가르쳐 줄 것입니다 여기 이것은 이 직선형 회귀를 사용한 추측입니다