Allen's 데이터 맛집

데이터의 속성 본문

Data Analysis/통계&분석

데이터의 속성

Allen93 2023. 10. 17. 22:19

데이터 분석에서 데이터는 주로 범주형과 수치형의 두 가지 주요 속성으로 분류됩니다. 이들은 데이터를 이해하고 분석하는 데 중요한 기반이 됩니다. 그런데 이 속성들은 더 나아가서 세부적으로 명목형, 순위형, 이산형, 연속형 등으로 나눌 수 있습니다.


범주형(Categorical) 데이터:


명목형(Nominal) 데이터는 카테고리 간에 순서나 계층이 없는 데이터를 의미합니다. 예를 들어, 사람들의 혈액형(A, B, AB, O)이 여기에 해당합니다.


순위형(Ordinal) 데이터는 카테고리 간에 상대적인 순서나 등급이 있는 데이터를 말합니다. 예를 들어, 영화 평점(1점, 2점, 3점 등)이 여기에 속합니다.

 


수치형(Numerical) 데이터:


이산형(Discrete) 데이터는 셀 수 있는 값들을 가지며 불연속적인 값을 나타냅니다. 예를 들어, 주사위를 던져 나오는 눈금(1, 2, 3, 4, 5, 6)이 여기에 해당합니다.


연속형(Continuous) 데이터는 무한한 값을 가지며 연속적인 범위에서 측정된 데이터를 나타냅니다. 예를 들어, 사람의 키나 몸무게와 같은 지속적으로 변화하는 값이 여기에 속합니다.

 

 


이러한 데이터 유형은 데이터 분석가가 데이터를 이해하고 적절한 분석 기술을 적용하는 데 큰 역할을 합니다. 예를 들어, 명목형 데이터를 분석할 때는 빈도나 비율을 통해 카테고리 간 차이를 알아볼 수 있고, 순위형 데이터를 분석할 때는 등수나 등급을 비교하여 순서를 파악할 수 있습니다. 또한, 이산형 데이터는 특정 값들의 출현 빈도를 파악하여 패턴을 분석할 수 있고, 연속형 데이터는 분포나 평균, 표준편차 등을 통해 데이터의 분산과 경향을 파악할 수 있습니다. 이러한 데이터의 특성을 이해하면 적절한 분석 방법을 선택하여 데이터에서 유의미한 정보를 도출할 수 있습니다.