목록클러스터링 (2)
Allen's 데이터 맛집

이번에는 데이터 분석에서 중요한 역할을 하는 군집분석(Cluster Analysis)에 대해 알아보겠습니다. 군집분석은 비슷한 특성을 갖는 데이터들을 그룹으로 묶어주는 방법으로, 데이터를 이해하고 패턴을 발견하는 데 유용합니다. 군집분석의 종류 군집분석에는 여러 가지 종류가 있으며, 각각의 종류는 다양한 방법으로 데이터를 군집화합니다. 여기서는 주요한 군집분석 알고리즘 몇 가지를 살펴보겠습니다. 1. K평균 군집화 (K-Means Clustering): 가장 일반적으로 사용되는 군집분석 알고리즘 중 하나로, 주어진 데이터를 K개의 클러스터로 그룹화합니다. 각 클러스터의 중심점과 해당 클러스터에 속한 데이터 포인트들 간의 거리를 최소화하는 방식으로 동작합니다. 2. DBSCAN (Density-Based ..

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 밀도 기반의 클러스터링 알고리즘으로, 데이터 포인트의 밀도에 따라 클러스터를 형성합니다. 이 알고리즘은 데이터의 밀도가 높은 지역을 클러스터로 간주하고, 데이터 포인트들 간의 거리를 기반으로 클러스터를 식별합니다. DBSCAN은 노이즈를 자동으로 처리할 수 있는 장점이 있어 실제로 많이 사용되는 알고리즘 중 하나입니다. 이미지출처:https://medium.com/@jayaramganesh238/dbscan-clustering-dea27873ed30 장점 1. 유연성: 클러스터의 모양에 대한 가정이 없어 다양한 형태의 클러스터를 식별할 수 있습니다. 2. 이상치 탐지: 노이즈 포인트..