본문 바로가기
🍌ADSP

[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 회귀분석

by 김말자 2022. 5. 19.
728x90
728x90
BIG

회귀분석

하나나 그이상 독립변수들이 종속변수에 미치는 영향을 말하는것

 

y = ax+b

 

선형회귀분석의 가정

선형성 - 선으로 이뤄져야됨

등분산성 - 잔차들이 일정한형태를 보여야함

독립성 - 대각선, 직선형태여야함

비상관성

정상성 - 오차의 분포가 정규분포를 따름

 

단순선형회귀분석

입력변수와 출력변수간의 선형성 점검하기 위해 산점도 확인

 

회귀계수 의미는 t통계량의 p벨류값이 0.05보다 작으면 유의함

설명력은 r스퀘어값 0~1 높을수록 설명력이 높다

 

lm (종 독) ~ 는 회귀분석이라는 뜻임 

p벨류값

df는 자유도

df+1 갯수

r스퀘어는 결정계수인데 잘 설명하고 있다는 뜻임

adjust r스퀘어 값보다 작으면 유의하지않음

 

glm 로지스틱회귀분석

 

 

다중선형회귀분석

선형성, 등분산성, 독립성, 정상성 모두 만족하는지 확인

 

최적회귀방정식

설명변수 - 타협

모형선택 - 분석 데이터에 가장 잘 맞는 모형을 찾아내는 방법

단계적 변수선택

전진선택법 안정성부족
후진제거법 독립변수 후보모두포함한 모형해서 변수를 제거해 더이상 제거할 수 없을떄까지 제거
단계선택법 전진선택법에 변수추가해 기존변수중요도가 약화되면 추가 또는 제거함

 

728x90
반응형
BIG

댓글