Allen's 데이터 맛집

기계분류에서 분류와 군집의 차이는? 본문

Machine Learning/머신러닝

기계분류에서 분류와 군집의 차이는?

Allen93 2024. 1. 7. 18:14

분류(Classification)와 군집(Clustering)은 기계 학습의 두 가지 주요 작업입니다. 그러나 이 두 작업은 목적과 접근 방식에서 차이가 있습니다.

 




1. 분류 (Classification)


목적: 주어진 입력 데이터를 사전에 정의된 클래스 또는 범주로 분류하는 것이 목표입니다.
학습 방식: 지도학습(Supervised Learning)에 해당합니다. 레이블이 지정된 훈련 데이터를 사용하여 모델을 학습하고, 새로운 데이터에 대한 클래스를 예측합니다.
예시: 스팸 메일 감지, 손글씨 숫자 인식, 암 진단 등

 


2. 군집 (Clustering)


목적: 주어진 데이터를 비슷한 특성이나 패턴을 공유하는 그룹 또는 군집으로 나누는 것이 목표입니다.
학습 방식: 비지도학습(Unsupervised Learning)에 해당합니다. 레이블이 지정되지 않은 데이터를 사용하여 유사한 패턴이나 구조를 찾아냅니다.
예시: 고객 세분화, 이미지 세그멘테이션, 문서 군집화 등


주요 차이점


1.레이블 유무

- 분류: 훈련 데이터에는 입력과 함께 정해진 클래스 레이블이 존재합니다.
- 군집: 훈련 데이터에는 레이블이 없으며, 비슷한 특성을 가진 데이터끼리 그룹화합니다.


2.목표
- 분류: 명시적으로 정의된 클래스 레이블에 대한 예측을 목표로 합니다.
- 군집: 유사한 데이터끼리 그룹화하여 구조를 찾는 것이 목표입니다.


3.학습 방식
- 분류: 지도학습 방식을 사용하여 훈련 데이터로부터 모델을 학습합니다.
- 군집: 비지도학습 방식을 사용하여 레이블이 지정되지 않은 데이터로부터 패턴이나 구조를 찾습니다.


4.예시

분류: 이메일 분류, 얼굴 인식, 스팸 필터링 등
군집: 고객 세분화, 이미지 그룹화, 자연어 문서 군집화 등

 


분류는 정확한 클래스 레이블을 예측하는 것에 중점을 둔 지도학습 작업이며, 군집은 데이터의 내재된 구조를 찾는 데 중점을 둔 비지도학습 작업입니다.

728x90