728x90
728x90
BIG
데이터마트 피벗테이블이랑 비슷
데이터마트는 데이터웨어하우스와 사용자 사이의 중간층에 위치한것
하나의 부서중심의 데이터웨어하우스라고도 함
reshape = 데이터는 여러계층 또는 수준으로 그롭화 시킬 수 있는데어떤 변형을 어떻게[ 수행해야할 것인지 재정렬하는 기법 중 하나
변수명을 보려면 names("")
CRM 관련 업무 중에서 핵심
고객 데이터 마트 구축
요약변수
분석에 맞게 종합한 변수
총구매금액, 금액, 횟수, 구매여부 등 분석을 위해 만들어지는 변수로 재활용이 높음
파생변수
특정조건을 만족하거나 특정함수에 의해 값을 만들어 의미를 부여한 변수/ 주관적임
reshape melt,cast 두개 핵심함수가 있음
melt 녹이는 함수 / 원데이터형태로 만드는함수
cast 모양을 만드는 함수 / 요약형태로 만드는 함수
이때 결측값 제거를 위해 na.rm = 'TRUE'로 하면 결측치가 사라짐
sqldf를 이용한 분석
sql을 사용할 수 있게 해줌
plyr를 이용한 분석
apply함수 기반, 데이터와 출력변수를 동시에 배열로 치환해줌
set.seed 난수생성시 고정시켜주는 역할
데이터테이블
data.table 큰 데이터를 탐색,연산,병합하는데 스는 것
빠른 속도를 위해 씀
DT[,] 조회할때 씀
728x90
반응형
BIG
'🍌ADSP' 카테고리의 다른 글
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 /통계분석(통계,표본조사,모수검정,비모수검정,측정방법등) (0) | 2022.05.19 |
---|---|
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 이상값 검색(boxplot)과 데이터가공과 관리 (0) | 2022.05.19 |
[ADSP 데이터분석준전문가자격증]2과목 데이터분석기획/분석마스터플랜 (0) | 2022.05.18 |
[ADSP 데이터분석준전문가자격증]2과목 데이터 분석 기획 / 분석프로젝트 관리방안 (0) | 2022.05.18 |
[ADSP 데이터분석준전문가자격증]2과목 데이터 분석 기획 / 분석과제발굴 (0) | 2022.05.18 |
댓글