요약
https://ko.wikipedia.org/wiki/%EA%B2%B0%EC%A0%95_%ED%8A%B8%EB%A6%AC_%ED%95%99%EC%8A%B5%EB%B2%95
의사결정나무와 엔트로피
https://gomguard.tistory.com/86
https://danbi-ncsoft.github.io/study/2018/12/06/entropy.html
분류트리
https://becominghuman.ai/decision-trees-in-machine-learning-f362b296594a
https://www.youtube.com/watch?v=2Rd4AqmLjfU
회귀트리
https://ratsgo.github.io/machine%20learning/2017/03/26/tree/
의사결정트리 알고리즘
http://contents2.kocw.or.kr/KOCW/document/2017/yeungnam/leejeayoung/4.pdf
ID3 (Iterative Dichotomiser 3) - 범주형자료만 분류가능
https://jihoonlee.tistory.com/16?category=725291
C4.5 (successor of ID3) - 수치형(범주형)자료처리
C5.0 (successor of ID4)
https://jihoonlee.tistory.com/17?category=725291
CART (Classification And Regression Tree)
CHAID (CHi-squared Automatic Interaction Detector) : 이 알고리즘은 분류 트리를 계산할 때 다단계 분할을 수행한다.
MARS (Multivariate adaptive regression splines) : 더 많은 수치 데이터를 처리하기 위해 결정 트리를 사용한다.
조건부 추론 트리 (Conditional Inference Trees) : 과적합을 피하기 위해 여러 테스트에 대해 보정 분할 기준으로 비 - 파라미터 테스트를 사용하는 통계 기반의 방법이다. 이 방법은 편견 예측 선택 결과와 가지 치기가 필요하지 않다.
ID3와 CART방법은 비슷한 시기인 1970년과 1980년 사이에 독립적으로 발명되었으며, 훈련 쌍에 대해 의사 결정 트리 학습을 위한 유사한 접근 방식을 사용한다. 위 알고리즘들 중에서 ID3, C4.5, C5.0 알고리즘들은 인공지능, 기계학습 분야에서 개발되어 발전되어 왔다. 이에 반해, CART 및 CHAID 알고리즘은 통계학에 분야에서 개발된 알고리즘들이다. 인공지능, 기계학습 계열의 알고리즘들은 엔트로피, 정보이득 개념을 사용하여 분리기준을 결정하고, 통계학에 기초한 CART 및 CHAID 알고리즘들은 카이스퀘어, T검정, F검정 등의 통계분석법을 사용한다.
http://katalog.egloos.com/3191268
과적합 방지알고리즘
https://www.youtube.com/watch?v=JM7TePqW5H0
랜덤포레스트
https://swalloow.tistory.com/92
'머신러닝 > 스터디 정리' 카테고리의 다른 글
용어정리 1 (0) | 2019.02.09 |
---|---|
Activation Function (0) | 2018.08.26 |
PCA 구현하기 (0) | 2018.08.20 |
numpy 간단한 선형회귀 예제 (0) | 2018.08.18 |
numpy 연산2 (0) | 2018.08.18 |