목록전체 글 (449)
Allen's 데이터 맛집
1. 표본 하나로 세상을 알 수 있을까?자동차 공장에서 부품 10,00개를 만들었다고 합시다.이 중 몇 개만 뽑아서 평균 무게를 잴 때, 그 평균은 과연 믿을 만할까요?표본 평균이 모집단 평균과 얼마나 다를까?표본을 여러 번 뽑으면 결과가 들쭉날쭉할까? 이때 등장하는 개념이 바로 표본평균의 분포(Sampling Distribusion of th Mean)입니다.그리고 이걸 통계적으로 설명하는 것이 바로 중심극한정리예요.2. 중심극한정리, 한 문장으로 말하면"표본을 충분히 많이 뽑아 그 평균을 구하면,그 평균들은 원래 분포가 어떤 모양이든 결국 정규분포를 따른다." 이게 전부입니다.정말 단순하지만, 통계학이 굴러가는 핵심 원리예요.3. 한눈에 보는 구조개념 ..
1. 동전 던지기와 품질검사, 같은 이야기동전을 10번 던졌을 때, 앞면이 정확히 6번 나올 확률은 얼마일까요?"혹은 하루에 생산된 부품 100개 중 불량이 3개일 확률은? 이 두 상황은 전혀 달라 보이지만, 수학적으로는 완전히 같은 문제예요. 둘 다 다음 조건을 만족하죠. 1. 결과는 두 가지뿐이다. -> 성공 / 실패2. 각 시행은 독립적이다. -> 앞면이 나왔다고 다음에 영향 없음3. 성공 확률은 일정하다. -> p가 변하지 않음4. 시행 횟수 n이 정해져 있다. 이 네 가지 조건이 충족될 때, 우리는 "이항분포를 따른다"라고 말합니다.2. 수식은 짧고, 의미는 깊다이항분포의 확률은 이렇게 생겼어요. 기호 ..
1. 확률이 '가능성의 언어'라면,확률변수는 그 언어를 숫자로 번역한 존재입니다.확률변수(random variable)는 이름이 조금 헷갈려요."랜덤한 변수"라기보다,"확률도 정의된 세상에서 우리가 관심 있는 값을 숫자로 표현한 도구"라고 보는 게 더 정확합니다.예를 들어 동전을 던질 때,앞면 -> 1점뒷면 -> 0점으로 두면, 동전 던지기는 "1 또는 0을 내는 확률변수"가 됩니다.즉, 세상의 불확실한 사건을 숫자로 바꾸는 일.이게 확률변수의 역할이에요.2. 확률변수의 두 가지 종류구분 설명 예시이산형 (Discrete)셀 ..
1. 확률은 '예측'이 아니라 '태도'입니다. 출근길에 하늘이 잔뜩 하려 있고 비가 올 확률이 70%라고 합니다. 이때 우리는 종종 이렇게 생각하죠. "70%면 비 오겠네.""30%면 안 올 수도 있잖아?" 그런데 확률이란 건 "오늘"의 날씨를 말하는 게 아니에요."이런 조건의 날씨가 100번 있었다면, 그중 70번은 비가 왔다"는 의미죠.즉, 확률은 '단 한 번의 사건'이 아니라 '반복되는 세상'을 보는 언어예요. 이걸 감으로 잡으면, "확률이 높다/낮다"는 말이 단순한 수치가 아니라"얼마나 일관된 패턴인가"를 말한다는 걸 알게 됩니다.2. 확률은 결국 '가능성의 크기'를 재는 도구확률의 정의는 간단합니다.예를 들어 동전을 던졌을 때 앞면이 나올 확률은 1/2.하지만 여기서 중요한 건 수식보다사고방식이..
