평균, 분산, 표준편차 공식
정규분포 표준화
정규 분포 또는 가우시안 분포는 연속 확률 분포의 하나이다. 정규분포는 수집된 자료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다.
정규분포는 2개의 매개 변수 평균 과 표준편차 에 대해 모양이 결정되고, 이때의 분포를 로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 을 표준정규분포(standard normal distribution)라고 한다.
정규 분포 밀도 함수에서 를 통해 X를 Z로 정규화함으로써 평균이 0, 표준편차가 1인 표준정규분포를 얻을 수 있다.
z-분포라고도 부른다. z-분포로 하는 검정(test)을 z-검정(z-test)이라고 한다.
에서 k값이 변화함에 따라 구해지는 값을 불확실성(uncertainty)이라고 한다. 예를 들어 를 90% 불확실성, 는 95% 불확실성, 은 99% 불확실성이다. 특히, 를 50% 불확실성이라고 하며, 확률오차(probable error)라고도 한다. 이는 관측값이 전체 관측값의 50%에 있을 확률을 의미한다.
[참고]
https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C_%EB%B6%84%ED%8F%AC
'머신러닝 > 스터디 정리' 카테고리의 다른 글
상관계수 (0) | 2018.08.16 |
---|---|
PCA (0) | 2018.08.14 |
Aprior 알고리즘 (0) | 2018.08.12 |
K-means 알고리즘 (0) | 2018.08.12 |
Json.Net (0) | 2018.08.09 |