본문 바로가기
728x90
320x100
SMALL
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 분류분석 분류분석? 어떤그룹에 속하는지 예측 군집분석과 유사하지만 각그룹이 정의되어있다는게 차이 지도학습 분류기법 회귀분석 로지스틱회귀분석 의사결정나무 CART 인공신경망 KNN 로지스틱회귀분석 범주형 사후확률 목적 선형회귀분석 로지스틱 회귀분석 종속변수 연속형 (0,1) 계수 추정법 최소제곱법 최대우도추정법 모형검정 F-TEST, T-TEST 카이제곱검정 glm 로지스틱회귀분석임 glm 종속변수 독립변수들의 합 피벨류값이 0.05인지확인해야하고 자유도확인해야하고 귀무가설기각? 의사결정나무 빠르게만들 수 있고, 비정상 잡음데이터없이 민감함이 ㅇ벗이 분류가능ㄴ 정확도가 높다 분석과정 성장(정지규칙만족시중단), 지니지수,엔트로피지수, 카이제곱통계량 가지치기(불필요한크기제거), 타당성평가, 해석 의사결정나무 알고리즘 .. 2022. 5. 19.
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 이상값 검색(boxplot)과 데이터가공과 관리 이상값은 의도하지 않게 잘못입력하거나, 의도하지않게 입력되거나, 분석목적에 부학하지 않은경우, 불량인경우 분석에서 어떻게 전처리를 할지 결정할 때나 부정사용방지 시스템에서 규칙을 발견하는 데 사용 이상값은 상자그림으로 판별 인식방법 ESD - 평균으로부터 3표준편차 떨어진값 trimming 10%절단(상위5퍼하위5퍼절단) boxplot y = rmorm -> 난수 갯수 outlier 평균과 가장 차이가 많이 나는 값 변수구간화방법 binning = 신용평가모형의 개발에서 연속형 변수를 범주형 변수로 구간화할때 의사결정나무 = 연속형변수가 반복적으로 선택할 경우 데이터EDA(탐색적 자료분석) summary() 2022. 5. 19.
728x90
반응형
BIG