목록차원의-저주 (2)
Allen's 데이터 맛집

데이터 분석에서 중요한 역할을 하는 연관분석(Association Analysis)에 대해 알아보겠습니다. 연관분석은 상품 간의 관계를 발견하여 패턴을 파악하는 데 사용되며, 특히 마케팅 및 판매 전략을 수립하는 데 유용한 도구입니다. 이미지출처:https://blog.naver.com/gkenq/10188110816 연관분석의 개념 연관분석은 대량의 데이터에서 상품이나 사건들 간의 연관성을 파악하는 분석 기법입니다. 특히 '만약 A라는 상품을 구매한 고객은 B도 구매할 가능성이 높다'와 같은 규칙을 발견하는 데 사용됩니다. 연관분석의 종류 연관분석에는 주로 아래와 같은 두 가지 알고리즘이 사용됩니다. 1. Apriori 알고리즘: 가장 일반적으로 사용되는 연관분석 알고리즘으로, 빈발 집합을 찾아내어 연..

차원 축소는 데이터의 변수(차원)를 줄이는 과정을 의미합니다. 이를 통해 데이터의 복잡도를 감소시키고, 모델의 성능을 향상시키며, 해석력을 향상시킬 수 있습니다. 반면에 차원의 저주는 데이터의 차원이 증가함에 따라 데이터를 설명하기 위해 필요한 샘플 데이터의 수가 기하급수적으로 증가한다는 현상을 의미합니다. 이로 인해 모델의 정확도가 떨어지고, 불필요한 저장 공간과 처리 시간이 증가하게 됩니다. 이미지출처:https://codingalzi.github.io/handson-ml3/dimensionality_reduction.html 따라서 차원 축소는 모델을 간소화하고 해석하기 쉽게 만들어주지만, 변수가 잃어버릴 수 있는 정보가 있으므로 주의해야 합니다. 차원의 저주를 피하기 위해서는 적절한 변수 선택, ..