statistics

데이터 분석의 범위

임이레 2022. 11. 30. 00:52

- 기술통계 (Descriptive Statistics) 

 : 주어진 데이터의 분포나 빈도, 평균 등의 통계량을 통해서 데이터를 설명한다.

 : 현상을 설명 -> 모집단(population) 과 표본( Sample) 간의 비교 

 

- 추론통계(Inferential Statistics) 

 : 모집단에서 추출된 표본으로부터 모수와 관련된 통계량들의 값을 계산하고, 이것을 이용하여 모집단의 특성을 알아나가는 과정.

 : 가설검정 -> 예측의 영역

 

* 모수(parameter) : 모집단 분포 특성을 규정짓는 척도 .

 c.f 모수검정(parametric test) vs 비모수 검정(non-parametric test)

 c.f 빈도주의(frequentist) vs 베이지안(Bayesian)

 c.f 초모수, 초매개변수(hyper-parameter) -> machine learning에서 중요한 개념!! 

 

 * 추정(estimation)