목록데이터-분할 (1)
Allen's 데이터 맛집
데이터 분할기법 부스트랩(Boostrap)
오늘은 작은 데이터에서 빛을 발하는 부트스트랩(Bootstrap)에 대해 이야기하려고 해요. 작은 데이터셋에서도 통계적인 힘을 끌어올릴 수 있는 부트스트랩이란 무엇일까요? 부트스트랩이란? 부트스트랩은 통계학의 마법 같은 기술 중 하나입니다. 작은 샘플 데이터로부터 모집단의 특성을 추정하거나 가설을 검정하는 데에 사용됩니다. 작동 원리 1.샘플링 부트스트랩은 샘플 데이터에서 중복을 허용하며 무작위로 복원 추출합니다. 즉, 데이터에서 임의로 관측치를 선택하고, 다시 원래 데이터로 돌려놓고, 다음 번에 또 선택하는 식으로 샘플을 만듭니다. 2.추정 이렇게 만들어진 부트스트랩 샘플을 기반으로 우리가 원하는 통계량(평균, 중앙값 등)을 계산해봅니다. 여러 번 반복해서 샘플을 만들면, 우리는 통계량의 분포를 얻을 ..
Machine Learning/머신러닝
2024. 1. 11. 18:42