목록Data Analysis/통계&분석 (64)
Allen's 데이터 맛집

구간추정은 통계학에서 모수에 대한 추정값을 구간으로 제시하는 방법을 의미합니다. 즉, 어떤 모수에 대한 추정값을 단일 숫자로 제시하는 것이 아니라, 그 값이 존재할 것으로 예상되는 구간을 제공합니다. 이는 추정값의 불확실성을 나타내며, 통계적으로 신뢰할 수 있는 구간을 제공함으로써 추정의 정확성을 측정할 수 있게 합니다. 이미지출처:https://blog.naver.com/hny6-0070/220936964565 신뢰구간 (Confidence Interval) 신뢰구간은 구간추정의 결과물로, 모수가 특정 구간에 속할 가능성을 나타냅니다. 보통 95%, 90%, 99%와 같은 신뢰 수준을 사용하여 신뢰구간을 생성합니다. 예를 들어, "95%의 신뢰수준에서 모평균의 추정값은 50에서 60 사이에 있을 것이다..
최대 가능도 추정법(Maximum Likelihood Estimation, MLE)은 확률 분포에 기반하여 모델의 파라미터를 추정하는 통계적 방법 중 하나입니다. 이 방법은 주어진 데이터를 가장 그럴듯하게 설명하는 모델 파라미터 값을 찾는 것을 목표로 합니다. 최대 가능도 추정법의 핵심 가능도 함수 (Likelihood Function): 주어진 표본 데이터에 대한 확률 분포를 나타내는 가능도 함수를 정의합니다. 이 함수는 모델 파라미터를 입력으로 받아, 주어진 데이터가 발생할 확률을 나타냅니다. 로그 가능도 함수 (Log-Likelihood Function): 가능도 함수를 로그 변환한 로그 가능도 함수를 사용합니다. 이는 계산의 편의성 및 수치 안정성을 높이기 위한 목적이 있습니다. 모수 추정: 로그..

최소제곱법(Least Squares Method)은 통계 및 수학에서 선형 회귀 분석을 할 때 사용되는 방법 중 하나입니다. 이 방법은 데이터의 관찰값과 모델로 예측한 값 사이의 잔차(오차)를 최소화하여 최적의 모델 파라미터를 찾습니다. 주로 데이터에 대한 선형 관계를 나타내는 직선을 fitting하는 데 사용됩니다. 이미지 출처:https://ko.wikipedia.org/wiki/%EC%B5%9C%EC%86%8C%EC%A0%9C%EA%B3%B1%EB%B2%95 최소제곱법의 핵심 잔차의 제곱을 최소화: 주어진 데이터에서 모델로 예측한 값과 실제 관찰값 사이의 차이를 잔차라고 합니다. 최소제곱법은 이 잔차들의 제곱을 최소화하는 모델 파라미터를 찾는 것이 목표입니다. 선형 모델 가정: 최소제곱법은 모델이 ..
비모수적 추론은 모집단의 분포에 대한 가정 없이, 주어진 데이터에 대한 추론을 수행하는 통계적 방법입니다. 비모수적 통계는 데이터의 순위나 순서에 기반하여 작동하며, 모집단의 형태나 분포에 대한 가정을 하지 않기 때문에 유연성이 있습니다. 1. 부호검정 (Sign Test) 부호검정은 중앙값이 어떤 값과 같은지를 검정하는 방법 중 하나입니다. 데이터의 부호를 사용하여 두 관련 그룹 간의 차이를 검정할 수 있습니다. 2. 윌콕슨 순위 합 검정 (Wilcoxon Signed-Rank Test) 이는 두 집단 간의 중앙값 차이를 검정하는데 사용됩니다. 가설 검정에 순위를 사용하므로 정규분포에 대한 가정이 필요하지 않습니다. 3. 만·위트니 U 검정 (Mann-Whitney U Test) 두 독립적인 그룹 간의..