728x90
728x90
BIG
회귀분석
하나나 그이상 독립변수들이 종속변수에 미치는 영향을 말하는것
y = ax+b
선형회귀분석의 가정
선형성 - 선으로 이뤄져야됨
등분산성 - 잔차들이 일정한형태를 보여야함
독립성 - 대각선, 직선형태여야함
비상관성
정상성 - 오차의 분포가 정규분포를 따름
단순선형회귀분석
입력변수와 출력변수간의 선형성 점검하기 위해 산점도 확인
회귀계수 의미는 t통계량의 p벨류값이 0.05보다 작으면 유의함
설명력은 r스퀘어값 0~1 높을수록 설명력이 높다
lm (종 독) ~ 는 회귀분석이라는 뜻임
p벨류값
df는 자유도
df+1 갯수
r스퀘어는 결정계수인데 잘 설명하고 있다는 뜻임
adjust r스퀘어 값보다 작으면 유의하지않음
glm 로지스틱회귀분석
다중선형회귀분석
선형성, 등분산성, 독립성, 정상성 모두 만족하는지 확인
최적회귀방정식
설명변수 - 타협
모형선택 - 분석 데이터에 가장 잘 맞는 모형을 찾아내는 방법
단계적 변수선택
전진선택법 | 안정성부족 |
후진제거법 | 독립변수 후보모두포함한 모형해서 변수를 제거해 더이상 제거할 수 없을떄까지 제거 |
단계선택법 | 전진선택법에 변수추가해 기존변수중요도가 약화되면 추가 또는 제거함 |
728x90
반응형
BIG
'🍌ADSP' 카테고리의 다른 글
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 다차원척도법 (0) | 2022.05.19 |
---|---|
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 시계열분석 (0) | 2022.05.19 |
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 기초 통계분석(히스토그램,인과관계,피어슨,스피어만상관계수) (0) | 2022.05.19 |
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 /통계분석(통계,표본조사,모수검정,비모수검정,측정방법등) (0) | 2022.05.19 |
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 이상값 검색(boxplot)과 데이터가공과 관리 (0) | 2022.05.19 |
댓글