본문 바로가기
🍌ADSP

[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 분류분석

by 김말자 2022. 5. 19.
728x90
728x90
BIG

분류분석?

어떤그룹에 속하는지 예측

군집분석과 유사하지만 각그룹이 정의되어있다는게 차이

지도학습

 

분류기법

회귀분석

로지스틱회귀분석

의사결정나무

CART

인공신경망

KNN

 

로지스틱회귀분석

범주형

사후확률

목적 선형회귀분석 로지스틱 회귀분석
종속변수 연속형 (0,1)
계수 추정법 최소제곱법 최대우도추정법
모형검정 F-TEST, T-TEST 카이제곱검정

glm 로지스틱회귀분석임

glm 종속변수 독립변수들의 합

피벨류값이 0.05인지확인해야하고

자유도확인해야하고

귀무가설기각?

 

 

의사결정나무

빠르게만들 수 있고, 비정상 잡음데이터없이 민감함이 ㅇ벗이 분류가능ㄴ

정확도가 높다

분석과정

성장(정지규칙만족시중단),

지니지수,엔트로피지수, 카이제곱통계량

 

 

가지치기(불필요한크기제거),

 

타당성평가,

 

해석

 

의사결정나무 알고리즘

CART

불순도의 측도를 출력변수가 범주형일 경우 지니지수이용, 연속형인 경우 분산

 

예시

party

prob에 분배비율이 나와있음

 

728x90
반응형
BIG

댓글