본문 바로가기
🍌ADSP

[ADSP 데이터분석준전문가자격증]3과목 데이터 마트 / R reshape, SQLDF, PLYR, 데이터테이블

by 김말자 2022. 5. 19.
728x90
728x90
BIG

데이터마트 피벗테이블이랑 비슷

 

데이터마트는 데이터웨어하우스와 사용자 사이의 중간층에 위치한것

하나의 부서중심의 데이터웨어하우스라고도 함

 

reshape = 데이터는 여러계층 또는 수준으로 그롭화 시킬 수 있는데어떤 변형을 어떻게[ 수행해야할 것인지 재정렬하는 기법 중 하나

 

변수명을 보려면 names("")

 

CRM 관련 업무 중에서 핵심

고객 데이터 마트 구축

 

요약변수

분석에 맞게 종합한 변수

총구매금액, 금액, 횟수, 구매여부 등 분석을 위해 만들어지는 변수로 재활용이 높음

 

파생변수

특정조건을 만족하거나 특정함수에 의해 값을 만들어 의미를 부여한 변수/ 주관적임

 

reshape melt,cast 두개 핵심함수가 있음

melt 녹이는 함수 / 원데이터형태로 만드는함수

cast 모양을 만드는 함수 / 요약형태로 만드는 함수

 

이때 결측값 제거를 위해 na.rm = 'TRUE'로 하면 결측치가 사라짐

 

 

sqldf를 이용한 분석

sql을 사용할 수 있게 해줌

 

plyr를 이용한 분석

apply함수 기반, 데이터와 출력변수를 동시에 배열로 치환해줌

set.seed 난수생성시 고정시켜주는 역할

 

데이터테이블

 data.table 큰 데이터를 탐색,연산,병합하는데 스는 것

빠른 속도를 위해 씀 

DT[,] 조회할때 씀

728x90
반응형
BIG

댓글