728x90
반응형
모수적(parametric) 방법론이란?
데이터가 특정한 확률분포(ex. 정규분포, 이항분포)를 따른다고 전제한 후, 그 분포의 모수에 대한 검정을 실시하는 방법
비모수적(nonparametric) 방법론이란?
데이터가 특정한 확률분포를 따른다고 전제할 수 없거나 모집단에 대한 정보가 전혀 없을 때 실시하는 방법
특정 확률분포를 가정하지 않고, 데이터에 따라 모델의 구조 및 모수의 개수가 유연하게 바뀜
* 기계학습의 많은 방법론은 비모수 방법론에 속함
데이터로 모수를 추정해보자!
데이터의 확률분포를 가정했으면 모수를 추정해볼 수가 있음
잘 알고있는 정규분ㅍ의 경우 모수의 평균과 분산 추정량은 다음과 같음
$$\bar{X} = \frac{1}{N}\sum_{i=1}^{N}{X_i} $$
$$S^2 = \frac{1}{N-1}\sum_{i=1}^{N}(X_i - \bar{X})^2$$
표본분산을 구할 때 왜 N-1로 나누어줄까?
불편(unbiased)추정량을 구하기 위해서이다.
불편의 "편"이란 bias를 의미한다.
bias란? 추정량의 기댓값과 실제 모수와의 차이
즉, 불편추정량이란 기대값이 모수와 동일한 추정량을 의미한다.
표본 분산의 경우 N-1로 나누어주어야 모집단의 분산과 동일해지므로 N-1로 나누어준다.
728x90
반응형
'DL & ML > AI Math' 카테고리의 다른 글
몬테카를로 샘플링 (Monte Carlo) (0) | 2022.01.20 |
---|---|
조건부확률과 기댓값 (0) | 2022.01.20 |
확률변수와 확률분포 (0) | 2022.01.20 |