통계
특정집단이 수행한 조사,실험 드응ㄹ 통해 나온 결과를 요약된 형태된 자료
ex>일기예보, 물가/실업률,의식조사,사회조사분석통계 등
총조사와 표본조사로 구분
통계자료방법
총조사/전수조사
- 대상집단 모두를 조사하는데 많은 비용과 시간이 소요
특별한 경우를 제외하고는 안함
표본조사
-샘플 추출
모집단 = 대상집단전체
원소 = 모집단을 구성하는 객체
표본 = 모집단의 일부원소
모수 = 모집단에 대한 정보
표본 추출 방법
단순랜덤추출법 - 샘플에 번호 부여해 n개를 추출하는 방법
계통추출법 - 샘플을 나열해 k개씩 n구간으로 나눠서 n개의 표본 선택 k번째 항목을 추천하는방법
ex 5개 마다 조사
집략추출법 - 군집구분, 다눈램덤추출법수행후 모든자료활용하거나 샘플링하는법
층화추출법 - 모집단에서 각 계층을 고루 대표할 수 있도록 표본을 추출하는 방법 / 특정목적하에서 실험대상에게 처리를 가한 후 그결과를 관측해 자료를 수집
측정
표본조사 실시
측정방법
명목척도 | 어느집단에 속하냐?(성별,출생지) |
순서척도 | 서열관계(만족도,선호도) |
구간척도 | 속성의양, 등간척도라고도하고 간격이 의미가 있음(온도,지수) |
비율척도 | 절대적인 기준인 0이 존재, 사칙연산가능 |
통계분석
불확실한 현상 대상으로 정보를 구해 통계분석해 의사결정을 하는 과정
기술통계
통계적추론
모수검정 - 모집단의 특성인 모수를 분석
가설검정 - 가설이 옳고그른지
예측 - 미래의 불확실성 해결해서 효율적인 의사결정
확률 0~1 전체확률은 1
표본공간 모든 결과들의 집합
이산형 확률변수
0이 아닌 확률값을 갖는 확률변수를 셀수있는경우
베르누이 확률분포 | 결과가 2개나옴 |
이항분포 | 베르누이시행 n번반복했을때 성공할 확률 |
기하분포 | 성공활률이 a인 베르누이시행에서 첫번째 성공이 있기까지 x번 실패할 확률 |
다항분호 | 이항분포확장한걸로 3가지 이상결과를 가지는 반복시행에서 발생하는 확률분포 |
포아송분호 | 시공간 내 발생하는 사건의 발생횟수에 대한 확률분포 |
연속형 확률변수
가능한 값이 실수의 어느 특정구간 전체에 해당하는 확률변수
균일분포(일양분포) | 확률변수x가 균일한 확률을 가지는 확률분포 |
정규분포 | 평균이 뮤고, 표준편차가 분산인 x의 확률밀도함수(표준편차가 크면 퍼지는 그림) |
지수분포 | 어떤 사건이 발생할 떄까지 경과시간에 대한 연속활률분포 |
t분포 | 0을 중심으로 좌우가 동일한 분호(두집단의 평균이 동일한지 알고자할떄씀) |
x제곱분포 | 두집단 간의 동질성 검정에 활용 |
f분포 | 두집단간의 분산의 동일성검정 활용 |
추정
표본으로 부터 미지의 모수를 측정
점추정, 구간추정이 있음
확률포본 - 모수를 가지고 있다
점추정 - 모수가 특정한 값일 것이라고 추정
평균, 중위수, 최빈값등 사용
구간추정 - 모수가 특정한 구간에 있을것이라고 선언하는 것
신뢰수준이 주어져야함
가설검정
가설의 채택여부결정
귀무가설 | 비교하는 값과 차이가 없다,동일하다는 가설 |
대립가설 | 뚜렷한 증거가 있을대 주장하는 가설 |
검정통계량 | 관찰된 표본으로부터 구하는 통계량, 검정시 가설의 진위를 판단하는 기준 |
유의수준 | 귀무가설 기각하게 되는 확률으 크기 /귀무가설이 옳은데도 이를 기각하는 확률의 크기 |
기각역 | 귀무가설이 옳다는 전제하 검정통계량의 분포에서 확률이 유의수준인 부분 |
비모수검정 - 통계적 검정에서 모집단의 모수에 대한 검정은 모수적검정과 비모수적검ㅈ멍이 있다
모수적 방법 - 모집단 분포에 대한 가정하고, 검정실시 / 표본평균, 표본분산
비모수적방법 - 추출된 모집단의 분포에 대한 아무제약을 가하지 않고 검정을 실시하는 방법 / 순위나 차이부호로 검정
관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우 사용하고, 자료수가 많지않거나 서열관계가 나타나는 경우 이용
'🍌ADSP' 카테고리의 다른 글
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 회귀분석 (0) | 2022.05.19 |
---|---|
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 기초 통계분석(히스토그램,인과관계,피어슨,스피어만상관계수) (0) | 2022.05.19 |
[ADSP 데이터분석준전문가자격증]3과목 데이터분석 / 이상값 검색(boxplot)과 데이터가공과 관리 (0) | 2022.05.19 |
[ADSP 데이터분석준전문가자격증]3과목 데이터 마트 / R reshape, SQLDF, PLYR, 데이터테이블 (0) | 2022.05.19 |
[ADSP 데이터분석준전문가자격증]2과목 데이터분석기획/분석마스터플랜 (0) | 2022.05.18 |
댓글