Restaurante La Strada

선형 회귀 예제

Posted on

단일 예측 변수를 가진 선형 회귀를 단순 회귀라고 합니다. 실제 응용 프로그램에는 일반적으로 둘 이상의 예측 변수가 있습니다. 이러한 회귀는 다중 회귀라고합니다. 여러 선형 회귀 예제에 대한 자세한 내용은 예제 데이터와 함께 키 드라이버 해석에 대해 여러 선형 회귀를 사용하지 않아야 하는 이유에 대한 이 게시물을 확인하십시오. 회귀 모델을 작성하기 전에 변수를 분석하고 이해하는 것이 좋습니다. 아래의 그래픽 분석 및 상관 관계 연구가 도움이 될 것입니다. 이 연습의 목적은 속도(speed)와 통계적으로 유의한 선형 관계를 설정하여 거리(dist)를 예측하는 데 사용할 수 있는 간단한 회귀 모델을 작성하는 것입니다. 그러나 구문으로 이동하기 전에 이러한 변수를 그래픽으로 이해하려고 시도할 수 있습니다. 일반적으로 각 독립 변수(예측 변수)에 대해 다음 플롯이 그려져 다음 동작을 시각화합니다. 아무리 교육, 당신이 직업이있는 경우, 당신은 최저 임금을 얻을 것이다.

이것은 보장 된 금액입니다. 선형 회귀는 하나 이상의 입력 예측 변수 X를 기반으로 결과 변수 Y의 값을 예측하는 데 사용됩니다. 목표는 예측 변수(들)와 응답 변수 사이에 선형 관계(수학 공식)를 설정하여 예측 변수(Xs) 값만 알려진 경우 이 수식을 사용하여 응답 Y의 값을 추정할 수 있도록 하는 것입니다. 회귀가 예측한 것보다 더 많은 수익을 올린다면 누군가회귀가 예측한 것보다 적은 수익을 얻습니다. 모든 것이 고르게 됩니다. b 계수는 X의 한 단위 증가와 연관된 Y의 단위 증가 수입니다. 우리의 b 계수 0.64 IQ의 한 단위 증가 는 성능 증가 0.64 단위와 관련 된 것을 의미 합니다. 아래와 같이 산점도에 회귀 선을 추가하여 이를 시각화했습니다.

그래서, 만약 당신이 학교에 가서 공식에 0 년의 교육 값을 연결하지 않은 경우, 아마도 무슨 일이 일어날 수 있을까? 논리적으로, 회귀는 소득이 최저 임금이 될 것이라고 예측합니다. 따라서 회귀 분석의 핵심 출력은 2개의 숫자입니다: SAT와 GPA라는 두 개의 열이 있습니다. 이것이 바로 선형 회귀 예제가 될 것입니다. 더 자세히 살펴보겠습니다이 가로채기와 b 계수가 실제로 무엇을 의미하는지 명확히 하기를 바랍니다. 그러나 왜 SPSS는 다른 숫자 대신 = 34.3 및 b = 0.64를 생각해 내나요? 대답에 대한 한 가지 접근 방식은 회귀 잔류에서 시작됩니다. 회귀 잔차는 관찰된 값-경우에 따라 결과 변수에 대한 예측 값입니다. 아래 그림은 예제의 회귀 잔류를 시각화합니다. 처음 세 가지는 꽤 전통적인. 우리는 심지어 numpy 필요 하지 않습니다., 하지만 그것은 항상 좋은 거기 – 일부 작업에 대 한 도움의 손길을 빌려 준비.