목록Machine Learning/머신러닝 (44)
Allen's 데이터 맛집
SVM(Support Vector Machine)에 대한 간단한 소개를 해보려고 합니다. 이 블로그 포스팅에서는 통계와 머신 러닝의 중요한 주제 중 하나인 SVM에 초점을 맞춰 다루어보겠습니다. SVM이란? SVM은 Support Vector Machine의 약자로, 주로 분류 및 회귀 분석에 사용되는 강력한 머신 러닝 알고리즘입니다. 이는 데이터를 고차원 공간으로 매핑하여 각각의 클래스를 분리하는 초평면을 찾는 것이 핵심 아이디어입니다. SVM의 기본 원리 SVM의 기본 원리는 데이터를 가장 잘 나누는 초평면을 찾는 것입니다. 이때, 데이터의 일부만이 아닌 Support Vectors라고 불리는 데이터 포인트들이 초평면을 결정하는 데에 주요한 역할을 합니다. SVM의 간단한 예시 예를 들어, 두 개의 ..
오늘은 작은 데이터에서 빛을 발하는 부트스트랩(Bootstrap)에 대해 이야기하려고 해요. 작은 데이터셋에서도 통계적인 힘을 끌어올릴 수 있는 부트스트랩이란 무엇일까요? 부트스트랩이란? 부트스트랩은 통계학의 마법 같은 기술 중 하나입니다. 작은 샘플 데이터로부터 모집단의 특성을 추정하거나 가설을 검정하는 데에 사용됩니다. 작동 원리 1.샘플링 부트스트랩은 샘플 데이터에서 중복을 허용하며 무작위로 복원 추출합니다. 즉, 데이터에서 임의로 관측치를 선택하고, 다시 원래 데이터로 돌려놓고, 다음 번에 또 선택하는 식으로 샘플을 만듭니다. 2.추정 이렇게 만들어진 부트스트랩 샘플을 기반으로 우리가 원하는 통계량(평균, 중앙값 등)을 계산해봅니다. 여러 번 반복해서 샘플을 만들면, 우리는 통계량의 분포를 얻을 ..
분류(Classification)와 군집(Clustering)은 기계 학습의 두 가지 주요 작업입니다. 그러나 이 두 작업은 목적과 접근 방식에서 차이가 있습니다. 1. 분류 (Classification) 목적: 주어진 입력 데이터를 사전에 정의된 클래스 또는 범주로 분류하는 것이 목표입니다. 학습 방식: 지도학습(Supervised Learning)에 해당합니다. 레이블이 지정된 훈련 데이터를 사용하여 모델을 학습하고, 새로운 데이터에 대한 클래스를 예측합니다. 예시: 스팸 메일 감지, 손글씨 숫자 인식, 암 진단 등 2. 군집 (Clustering) 목적: 주어진 데이터를 비슷한 특성이나 패턴을 공유하는 그룹 또는 군집으로 나누는 것이 목표입니다. 학습 방식: 비지도학습(Unsupervised Lea..
지도학습, 비지도학습, 준지도학습, 그리고 강화학습은 기계 학습의 주요 패러다임을 나타냅니다. 각각의 학습 방법에는 특정한 특징과 목적이 있습니다. 1. 지도학습 (Supervised Learning) 지도학습은 입력 데이터와 그에 상응하는 정답(레이블)을 사용하여 모델을 훈련시키는 방법입니다. 모델은 입력과 정답의 관계를 학습하고, 새로운 입력이 주어졌을 때 해당 정답을 예측할 수 있습니다. 지도학습은 분류(Classification)와 회귀(Regression) 문제에 주로 사용됩니다. 예시: 이미지 분류, 스팸 메일 감지, 주택 가격 예측 등 2. 비지도학습 (Unsupervised Learning) 비지도학습은 정답(레이블)이 주어지지 않은 데이터에서 패턴이나 구조를 찾는 방법입니다. 모델은 데이..