목록Machine Learning (47)
Allen's 데이터 맛집
오늘은 작은 데이터에서 빛을 발하는 부트스트랩(Bootstrap)에 대해 이야기하려고 해요. 작은 데이터셋에서도 통계적인 힘을 끌어올릴 수 있는 부트스트랩이란 무엇일까요? 부트스트랩이란? 부트스트랩은 통계학의 마법 같은 기술 중 하나입니다. 작은 샘플 데이터로부터 모집단의 특성을 추정하거나 가설을 검정하는 데에 사용됩니다. 작동 원리 1.샘플링 부트스트랩은 샘플 데이터에서 중복을 허용하며 무작위로 복원 추출합니다. 즉, 데이터에서 임의로 관측치를 선택하고, 다시 원래 데이터로 돌려놓고, 다음 번에 또 선택하는 식으로 샘플을 만듭니다. 2.추정 이렇게 만들어진 부트스트랩 샘플을 기반으로 우리가 원하는 통계량(평균, 중앙값 등)을 계산해봅니다. 여러 번 반복해서 샘플을 만들면, 우리는 통계량의 분포를 얻을 ..
분류(Classification)와 군집(Clustering)은 기계 학습의 두 가지 주요 작업입니다. 그러나 이 두 작업은 목적과 접근 방식에서 차이가 있습니다. 1. 분류 (Classification) 목적: 주어진 입력 데이터를 사전에 정의된 클래스 또는 범주로 분류하는 것이 목표입니다. 학습 방식: 지도학습(Supervised Learning)에 해당합니다. 레이블이 지정된 훈련 데이터를 사용하여 모델을 학습하고, 새로운 데이터에 대한 클래스를 예측합니다. 예시: 스팸 메일 감지, 손글씨 숫자 인식, 암 진단 등 2. 군집 (Clustering) 목적: 주어진 데이터를 비슷한 특성이나 패턴을 공유하는 그룹 또는 군집으로 나누는 것이 목표입니다. 학습 방식: 비지도학습(Unsupervised Lea..
지도학습, 비지도학습, 준지도학습, 그리고 강화학습은 기계 학습의 주요 패러다임을 나타냅니다. 각각의 학습 방법에는 특정한 특징과 목적이 있습니다. 1. 지도학습 (Supervised Learning) 지도학습은 입력 데이터와 그에 상응하는 정답(레이블)을 사용하여 모델을 훈련시키는 방법입니다. 모델은 입력과 정답의 관계를 학습하고, 새로운 입력이 주어졌을 때 해당 정답을 예측할 수 있습니다. 지도학습은 분류(Classification)와 회귀(Regression) 문제에 주로 사용됩니다. 예시: 이미지 분류, 스팸 메일 감지, 주택 가격 예측 등 2. 비지도학습 (Unsupervised Learning) 비지도학습은 정답(레이블)이 주어지지 않은 데이터에서 패턴이나 구조를 찾는 방법입니다. 모델은 데이..
제가 예전에 머신러닝에 대해서 공부를 하다가 흥미로운 아이디어를 제출하고, 함께 공유할 수 있는 사이트를 공유하겠습니다. 지도학습 분류사례 분류사례 제출 https://docs.google.com/forms/d/e/1FAIpQLSfDN7JtYYpAAw8SxEh0l1jKGRbGiZy0i-H2V7vKCFnHx7KR9g/viewform' 머신러닝 1 - 지도학습 / 분류의 사례 머신러닝/지도학습/분류의 좋은 사례가 있으면 알려주세요. 이곳에는 어느정도 검증이 된 정보가 등록 되었으면 좋겠습니다. docs.google.com 분류사례 아이디어 공유 https://docs.google.com/spreadsheets/d/1uPbxjqGmpgdNE14N_cFJs7CcPgOv60dbdkVEHldQpEw/edit#gid..