프로그래밍/머신러닝 & 딥러닝

비지도 학습 핵심 알고리즘

Jay_rock 2021. 9. 2. 01:52

지도 학습과 다르게 비지도 학습은 데이터의 특성이 필요하지 않다. 쉽게 말해 답을 가르쳐주지 않고 훈련을 시키는 방식이다. 

비지도 학습에는 유사성이 높은 데이터들을 같은 집단으로 분류하는 군집차원 축소 등의 방식을 사용한다.

 

 

 

- 지도 학습에서 많이 사용되는 핵심 알고리즘을 간단히 정리해보자 -

 

 

 

 

1.  K-Means 클러스터링

K- Means는 군집의 대표적인 알고리즘으로 데이터셋에서 클러스터를 구성할 때 주로 사용된다. 우선 K개의 중심점을 정하고 유사도를 이용하여 중심점에 가까운 데이터들을 각각 분류한다. 계산을 통해 중심점은 계속 바뀌며 중심점의 변화가 없을 때까지 진행된다. K-Means 클러스터링의 성능을 정하는 것은 K 값이다.

 

 

 

 

2. 밀도 기반 군집 분석 ( DBSCAN, Density-Based Spatial Clustering of Applications with Noise )

밀도 기반 군집 분석은 말 그대로 일정한 기준 이상의 밀도를 가진 데이터를 기준으로 분류하기 때문에 K-Means 클러스링과 다르게 K 값을 알 수 없을 때 사용하면 유용하다. 또한 이상치가 포함되었을 때 사용하기 편하다.  

 

 

 

 

3. 주성분 분석 ( PCA, Principal Component Analysis )

데이터에 특성이 너무 많아 하나의 그래프로 보기 어려울 때 특성을 두세개로 축약하여 시각화를 할 때 사용된다. 고차원의 데이터일수록 성능이 떨어지는 경향이 있기 때문에 고차원의 데이터를 저차원으로 축소시키는 알고리즘이다. 

 

 

 

 

더보기

본 내용은 < 딥러닝 텐서플로 교과서 (저자:서지영) > 내용을 바탕으로 작성되었습니다.
https://book.naver.com/bookdb/book_detail.nhn?bid=19482194