목록Data Analysis/통계&분석 (64)
Allen's 데이터 맛집
데이터 웨어하우스는 기업이나 조직이 다양한 소스로부터 수집한 데이터를 중앙 집중식으로 저장하고, 이를 효율적으로 분석하여 비즈니스 인텔리전스 및 전략적인 의사 결정을 지원하는 플랫폼입니다. 주로 거대한 양의 데이터를 처리하며, 이를 통해 기업의 성과를 개선하는 데 활용됩니다. 이미지출처:https://www.integrate.io/blog/what-is-a-data-warehouse/ 구성 요소. - ETL(Extract, Transform, Load) 프로세스: 데이터를 추출하고 변환한 후 데이터 웨어하우스로 로드하는 과정입니다. 여기서 데이터의 정제와 변환 작업이 이루어집니다. - 데이터 스토리지: 데이터를 저장하는 데 사용되는 물리적인 저장소입니다. 주로 관계형 데이터베이스(RDBMS)가 사용되며,..
다변량 분석은 여러 개의 독립 변수(또는 설명 변수)와 종속 변수(또는 반응 변수) 간의 관계를 분석하는 통계적 기법입니다. 데이터 간의 다양한 상호 관계를 이해하고 해석하는 데 사용됩니다. 다변량 분석의 개념 다변량 분석은 하나 이상의 종속 변수가 여러 개의 독립 변수에 의해 영향을 받는 경우를 다룹니다. 주로 다변량 분산 분석(ANOVA), 주성분 분석(PCA), 군집 분석, 판별 분석 등의 기법이 사용됩니다. 다변량 분석의 주요 기법 1. 다변량 분산 분석(ANOVA): 그룹 간의 평균 차이를 비교하는 기법으로, 종속 변수가 연속형이고 독립 변수가 범주형인 경우 사용됩니다. 2. 주성분 분석(PCA): 변수 간의 상관 관계를 고려하여 데이터를 새로운 축으로 변환하는 기법으로, 차원 축소와 데이터 시..
이번에는 부호검정에 대해 알아보겠습니다. 부호검정은 표본의 순위나 순서가 중요한 경우에 사용되는 비모수적인 가설 검정 방법 중 하나입니다. 주로 중앙값의 비교나 관련성을 검정하는 데 사용됩니다. 부호검정의 개념 부호검정은 데이터의 값 대신 부호에만 기반하여 가설을 검정하는 비모수적인 방법입니다. 주어진 데이터의 부호를 기록하여 가설을 검정하며, 데이터의 분포에 대한 가정이 필요하지 않습니다. 대표적으로 "중앙값의 차이가 없다"와 같은 가설을 검정하는 데 사용됩니다. 부호검정의 단계 1. 가설 설정: 귀무가설과 대립가설을 설정합니다. 대표적으로 "중앙값에 차이가 없다"와 같은 가설을 설정합니다. 2. 부호 계산: 주어진 데이터에서 각 쌍의 관측값의 차이에 대한 부호를 기록합니다. 이를 통해 양의 부호와 음..
이번에는 작은 표본 크기를 다루는 통계적 방법 중 하나인 피셔의 정확 검정에 대해 알아보겠습니다. 피셔의 정확 검정은 표본 크기가 작거나 가정이 만족되지 않는 경우에 사용되며, 비모수적인 방법으로 데이터를 분석합니다. 피셔의 정확 검정의 개념 피셔의 정확 검정은 범주형 데이터에 대한 가설 검정을 수행하는 통계적 방법입니다. 주어진 데이터로부터 관찰된 빈도와 기대 빈도를 비교하여 가설을 검정합니다. 주로 작은 표본 크기나 가정이 만족되지 않는 경우에 사용됩니다. 피셔의 정확 검정의 단계 1. 가설 설정: 귀무가설과 대립가설을 설정합니다. 귀무가설은 일반적으로 두 그룹 간의 차이가 없다는 것을 가정합니다. 2. 검정 통계량 계산: 주어진 데이터로부터 관찰된 빈도와 기대 빈도를 비교하여 검정 통계량을 계산합니..