목록빅분기 (11)
Allen's 데이터 맛집

이번 포스팅에서는 데이터 분석의 강력한 도구 중 하나인 앙상블(Ensemble) 기법에 대해 쉽게 알아보려고 합니다. 앙상블은 여러 모델을 결합하여 단일 모델보다 높은 성능을 얻을 수 있도록 도와주는 획기적인 방법 중 하나입니다. 앙상블 기법이란? 앙상블은 여러 다른 모델들을 결합하여 하나의 강력한 모델을 만드는 방법입니다. 이는 여러 모델의 다양성을 활용하여 성능을 향상시키는 아이디어에 기반합니다. Voting, Bagging, Boosting, Stacking: 간단히 알아보기 1. Voting (보팅) Voting은 여러 다른 모델들의 예측을 종합하여 최종 예측을 결정하는 방법입니다. 주로 더 간단하고 다양한 모델들을 결합하여 성능을 높이는 데 사용됩니다. 2. Bagging (베깅) Bagging..
SVM(Support Vector Machine)에 대한 간단한 소개를 해보려고 합니다. 이 블로그 포스팅에서는 통계와 머신 러닝의 중요한 주제 중 하나인 SVM에 초점을 맞춰 다루어보겠습니다. SVM이란? SVM은 Support Vector Machine의 약자로, 주로 분류 및 회귀 분석에 사용되는 강력한 머신 러닝 알고리즘입니다. 이는 데이터를 고차원 공간으로 매핑하여 각각의 클래스를 분리하는 초평면을 찾는 것이 핵심 아이디어입니다. SVM의 기본 원리 SVM의 기본 원리는 데이터를 가장 잘 나누는 초평면을 찾는 것입니다. 이때, 데이터의 일부만이 아닌 Support Vectors라고 불리는 데이터 포인트들이 초평면을 결정하는 데에 주요한 역할을 합니다. SVM의 간단한 예시 예를 들어, 두 개의 ..

Gartner의 Analytic Value Escalator는 기업이 데이터 분석 및 분석적 역량을 향상시키는 과정을 설명하는 프레임워크입니다. 이 모델은 기업이 데이터 활용에 있어서 단계별로 어떻게 가치를 창출하고 확장해 나갈 수 있는지를 보여줍니다. 아래는 Gartner's Analytic Value Escalator의 주요 단계에 대한 설명입니다. 이미지출처:https://www.flickr.com/photos/27772229@N07/8267855748 Descriptive Analytics (기술적 분석): 이 단계에서는 과거 데이터를 사용하여 사건에 대한 설명을 제공합니다. 이는 일반적으로 보고서 및 대시보드와 같은 시각화 도구를 통해 수행됩니다. Diagnostic Analytics (진단적 ..
데이터는 일반적으로 정형 데이터(Structured)와 비정형 데이터(Unstructured)로 유형으로 나눌 수 있습니다 정형 데이터(Structured): 정형 데이터는 표 형식의 데이터로, 행과 열에 의해 구조화되어 있습니다. 이것은 주로 스프레드시트 형태로 표현됩니다. 예를 들어, 기업의 ERP 또는 CRM 시스템에서 생성되는 거래 데이터나 수요 예측 데이터는 정형 데이터의 좋은 예입니다. 이러한 데이터는 주로 EIA(Enterprise Information Architecture) 또는 ETL(Extract, Transform, Load)과 같은 도구를 사용하여 수집 및 처리됩니다. 비정형 데이터(Unstructured): 비정형 데이터는 형태나 구조가 정형화되지 않은 데이터로, 잠재적으로 가치..