본문 바로가기
728x90
320x100
SMALL
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 이상값 검색(boxplot)과 데이터가공과 관리 이상값은 의도하지 않게 잘못입력하거나, 의도하지않게 입력되거나, 분석목적에 부학하지 않은경우, 불량인경우 분석에서 어떻게 전처리를 할지 결정할 때나 부정사용방지 시스템에서 규칙을 발견하는 데 사용 이상값은 상자그림으로 판별 인식방법 ESD - 평균으로부터 3표준편차 떨어진값 trimming 10%절단(상위5퍼하위5퍼절단) boxplot y = rmorm -> 난수 갯수 outlier 평균과 가장 차이가 많이 나는 값 변수구간화방법 binning = 신용평가모형의 개발에서 연속형 변수를 범주형 변수로 구간화할때 의사결정나무 = 연속형변수가 반복적으로 선택할 경우 데이터EDA(탐색적 자료분석) summary() 2022. 5. 19.
[R Studio] 결측치 데이터 탐색 summary 함수를 통해 4분위수, 최소,최대,중앙,평균을 출력가능 연속형 cov,cor함수로 공분산,상관계수행렬을 출력할 수잇음 cov 공분산 cor 상관계수 str()epdlxjrnwhvkdkr head(이름, 갯수) 숫자를 넣으주면 원하는 갯수 만큼 볼 수 있다 head(이름) 데이터에서 앞 6줄 만 보여줌 is.na(변수) 결측값인지 판단가능 complete.cases() 결측값 삭제 NULL 변수값이 초기화되어있지않고 비어있음 NA Not Available 데이터값없음 NaN Not available Number 숫자가 아니다(계산불가능한 값이 있는 경우) INF Infinite 무한대값 결측치가 많으면 측정시 값이 영향을 많이 받음 2022. 5. 19.
[R Studio] R 기초함수 rep, seq문 수열생성 rep 첫번째 인수를 몇번 반복할것인가? rep(수, 반복수) rep(1:3,3)도가능 seq 간단하게 a:b a~b까지 seq(첫:끝) seq(1,2,by=2) seq(1,11,length=10)length수열갯수지정 2022. 5. 19.
[ADSP 데이터분석준전문가자격증]2과목 데이터분석기획/분석마스터플랜 마스터플랜수립 프레임워크 분석과제 우선순위 고려요소 전략적중요도 ROI(투자자본수익률) 실행용이성 적용우선순위설정 적용범위/방식고려요소 업무내재화적용수준 분석데이터적용수준 기술적용수준 ANALYTICS구현로드맵수립 중장기적 마스터 플랜을 수립하기위해 분석과제를 대상으로 다양한 기준을 고려해 적용할 우선순위를 설정할 필요가 있음 분석과제 수행의 선/후행 관계를 고려해 우선순위를 조정해 나간다 분석과제의 적용범위 및 방식에 대해서도 종합적으로 고려하여 결정함 ROI 관점에서 빅데이터의 핵심특징 RETURN ON INVESTMENT 3V(투자비용요소) VOLUME 크기 VARIETY 다양성 VELOCITY 속도 4V(비즈니스효과) VALUE(가치) 포트폴리오 사분면 분석을 통한 과제 우선순위 선정 시급성 - .. 2022. 5. 18.
[ADSP 데이터분석준전문가자격증]2과목 데이터 분석 기획 / 분석과제발굴 디자인사고 ; 중요한 의사결정시 상향식,하향식방법 반복적으로 사용 상향식방식의 발산 DIVERGE 하향식접근방식의 수렴 CONVERGE 반복해 발굴 하향식 접근방법 워터풀, 폭포수방식 문제가 확실할대 사용 문제가 주어지고, 해법을 찾기위해 사용 문제 탐색 - 문제정의 - 해결방안탐색 - 타당성검토 - 비즈니스모델기반,문제탐색,외부사례기반문제탐색 - 데이터분석문제변환 - 수행옵션도출 - 타당성평가 - 과제선정 문제탐색 - 전체적 관점 기준모델활용 빠짐없이 문제를 도출하고 식별하는 것이 중요 발생하는 가치에 중점 업무,제품,고객,규제와감사,지원인프라 기업 - 경쟁자확대 - 대체재,경쟁자,신규진입자(경쟁사의동향) 기업 - 거시적관점 - 사회,기술,경제,환경,정치 STEEP 기업 - 시장니즈탐색 - 고객,채널,.. 2022. 5. 18.
[ADSP 데이터분석준전문가자격증]1과목 데이터사이언스와인사이트/빅데이터 미래 빅데이터시대 비용절감, 시간절약, 매출증대, 고객서비스향상, 신규비즈니스창출, 내부의사결정지원 과거 - 아날로그가 어떻게 디지털화되냐 현재 - 디지털화가 어떻게 효과적으로 제공? 미래 - 복잡한 연결을 얼마나 효과적으로 그리고 믿을 수 있게 관리하냐 데이터사이언스한계? 인간의해석거침 사람에따라 다른결과 데이터사이언스와 인문학 분석하고 가정하면 외부요인은 계속변함 2022. 5. 13.
[ADSP 데이터분석준전문가자격증]1과목 데이터사이언스와인사이트/인사이트도출을 위한 역량 데이터사이언스? 데이터로부터 의미있는 정보를 추출해내는 학문 정형,비정형, 다향한 위험 데이터마이닝에 초점 분석->구현->전달 포괄적,총체적,접근법 사업성과견인 통계학 정형화된데이터 역할 데이터사이언티스트는 소통력!중요 의미있는 발견/문제이면 파고들고, 질문찾고, 가설세우고!! 데이터사이언스의 구성요소 데이터사이언스의 영역 IT ANALYTIC 비즈니스 분석 데이터사이언티스트 역할 "호기심" 스토리텔링,커뮤니케이션, 창의력, 열정, 직관력, 비판적 시각, 글쓰기능력, 대화능력 요구역량 하드스킬 기본이론지식, 분석기술숙련 소프트스킬 통찰력,설들력,커뮤니케이션 복잡한 세계화 제품생산에서 서비스(생산에서 시장창조) 소비자의 재미,편의 찾는 통찰력이 필요하다 빅데이터 분석 = 텍스트마이닝기술, 평판분석,군집분석.. 2022. 5. 13.
[ADSP 데이터분석준전문가자격증]1과목 데이터사이언스와인사이트/빅데이터분석과전략인사이트 빅데이터열풍 빨리끓어오른냄비가 빨리식는 거품현상을 우려 빅데이터회의론 원인 부정적학습효과 과거의 고객관리CRM은 공포마케팅이 잘통하는 영역이어서 도입만하면 모든문제해소할것처럼 강조하고, 거액투자후에 어떻게 활용할지 선택을 못함 IT솔루션은 공포마케팅이 잘 통하는 영역 빅데이터성공사례가 기존분석프로젝트를 포함해서 과대포장이 많음 빅데이터는 분석을 통해 가치를 만드는거에 집중해야함 EX>싸이월드가 망한이유 데이터분석기반 경영문화의 부재때문 기존관행을 계속 따르고, 공정한 분석이 ㅇ벗고, 아이디어를 낸사람이 누구인지 관심을 두는 경향이 짙음 데이터 기반의 통찰, 유형의 다양성과 관측을 잘해야함 전략적 통찰이 ㅇ벗는 분석의 함정 국소적인 문제해결용도로사용하는 단계가 ㅇ벗음 빅데이터 그저그런것 -> 획기적속성제대.. 2022. 5. 13.
[ADSP 데이터분석준전문가자격증]1과목 데이터의 가치와 미래/미래의 빅데이터 빅데이터 활용의 3요소 기본 3요소 데이터(모든거데이터화) 사물인터넷(IOT)시대 웨어러블 제조업에서 서비스업으로 기술(인공지능기술발전) 인력(데이터사이언티스트,알고리즈미스트) 데이터사이언티스트 빅데이터에 대한 이론적지식,분석기술의 숙련으로 통찰,전달,협업을 갖춘 전문이력 빅데이터의 다각적 분석을 통해 인사이트도출가능 알고리즈미스트 데이터사이언티스트가 한일로인해 피해를 보는사람들을 막는 전문인력 2022. 5. 13.
728x90
반응형
BIG