susinlee 님의 블로그

2. 데이터의 유형 본문

학습/통계학

2. 데이터의 유형

susinlee 2025. 1. 11. 04:14

데이터에는 다양한 유형이 존재합니다. 예를 들어, 키, 몸무게처럼 숫자로 표현되는 데이터가 있는가 하면, 성별처럼 범주로 나타나는 데이터도 있습니다. 데이터의 유형에 따라 적합한 분석 방법이 달라지기 때문에, 데이터를 수집하거나 분석할 때는 그 유형을 명확히 파악하는 것이 중요합니다.


데이터의 유형

 

1. 수치형 데이터

  • 숫자로 나타낼 수 있는 데이터로, 대소 관계가 있고, 양을 계산할 수 있습니다.
  • 분류:
    1. 이산형 데이터
      • 관측 가능한 값이 셀 수 있는 수치형 데이터.
      • 수강생 수, 동전 던지기 횟수 등 (0, 1, 2 3, 4 ...)
    2. 연속형 데이터
      • 관측 가능한 값이 연속적인 수치형 데이터. 
      • 키, 몸무게, 온도 등. (176.2, 180.17, 32.5 ...)

2. 범주형 데이터

  • 숫자가 아닌 범주로 나타낼 수 있는 데이터입니다.
  • 분류:
    1. 순위형 데이터
      • 범주 간에 순서가 있는 데이터.
      • 만족도 조사, 점수 등급 등 (만족/보통/불만족, A/B/C ...)
    2. 명목형 데이터
      • 범주 간에 순서가 없는 데이터.
      • MBTI, 동전던지기 (INFP/ENFJ..., 앞/뒤 ...)

 

데이터 유형을 올바르게 파악하면, 적합한 분석 방법을 선택할 수 있습니다.

예를 들어,

  • 수치형 데이터평균이나 표준편차와 같은 수치로 분석할 수 있고
  • 범주형 데이터빈도비율을 활용한 통계량으로 분석할 수 있습니다.

 

변수

변수란, 일정한 방식으로 측정하거나 관찰하여 수집한 데이터의 특성을 의미합니다. 예를 들어, MBTI는 하나의 변수로 볼 수 있습니다. 이는 사람(대상)에 따라 서로 다른 값을 가질 수 있기 때문에 변수라고 부릅니다. 이때 MBTI는 INFP와 같은 범주로 표현되므로 범주형 변수로 분류할 수 있습니다.