susinlee 님의 블로그
1. 기초 통계학 소개 본문
통계학의 필요성
통계학을 배우는 이유는, 정보가 넘쳐나는 현대사회에서 정보의 신뢰성을 검증하는 강력한 도구이기 때문입니다. 또한, 통계는 타인을 설득하는 과정에서 객관적인 근거를 제공하는 유용한 수단으로 활용됩니다.
즉, 통계학은 정보의 신뢰성을 평가하고 설득력 있는 논리를 구축할 수 있도록 원리와 방법론을 제공합니다. 이제 이러한 통계학의 원리와 방법론에 대해 알아보겠습니다
모집단과 표본
통계학에서 중요한 기본 개념 중 하나가 모집단과 표본입니다. 이 두 용어를 이해하는 것은 통계적 분석의 기초를 다지는 데 필수적입니다. 예를 들어, 한국 여성의 평균 키를 알고자 한다고 가정해봅시다. 이를 정확히 구하기 위해서는 한국 국적을 가진 모든 여성의 키를 측정해야 합니다. 여기서 한국 국적을 가진 모든 여성의 키가 바로 모집단입니다. 그러나 현실적으로 모든 사람의 키를 측정하는 것은 시간과 비용 측면에서 비효율적이거나 불가능할 수 있습니다. 따라서 실제로 조사 가능한 일부 자료를 활용하여 전체를 추정하게 됩니다. 이때 조사하게 되는 일부 여성들의 키가 바로 표본입니다.
- 모집단: 알고자 하는 대상의 모든 개체나 관찰값들의 집합
- 표본: 모집단에서 선택된 일부 데이터
다른 예로, 특정 제약회사에서 비만 치료제를 개발했다고 가정해봅시다. 이 약의 효과를 검증하기 위해서는 미래에 약을 복용할 모든 비만 환자를 조사해야 합니다. 하지만 이는 이론적으로 불가능합니다. 대신, 현재 비만 환자 중 일부를 선택하여 표본으로 삼아 연구를 진행합니다. 이처럼 모집단에서 일부를 선택하는 과정을 표본추출이라고 합니다.
모집단과 표본은 통계학에서 정보를 추론하고 결론을 도출하는 데 중요한 기반이 됩니다.
첫 번째 예시에서 데이터 분석의 목적은 대한민국 여성의 평균 키를 알아내는 것이었고,
두 번째 예시에서는 신약의 효과 유무를 확인하는 것이었습니다.
이처럼 데이터 분석의 목적이 명확해지면, 알고자 하는 대상, 즉 모집단을 명확히 정의하는 것이 중요합니다.
모집단과 모수
분석의 목적은 보통 모집단의 특정 특성을 이해하는 데 있습니다.
예를 들어:
- 여성의 평균 키를 알면 대상을 설명하거나 이해할 수 있습니다.
- 신약 복용자의 평균 BMI를 알면 신약 효과를 예측할 수 있습니다.
이처럼 모집단의 특성을 나타내는 값을 모수라고 합니다.
모수를 추정하는 방법
모수를 알아내기 위해서는 모집단 전체를 조사하거나, 일부를 조사하여 모집단의 성질을 추정해야 합니다.
- 전수조사
- 모집단의 모든 개체를 조사하는 방식입니다.
- 모집단이 유한할 때만 가능하며, 비용과 시간이 많이 소요됩니다.
- 표본조사
- 모집단의 일부를 추출하여 조사하는 방식입니다.
- 모집단이 유한하더라도 전수조사가 어려운 경우나, 모집단이 무한할 경우에 유용합니다.
실제로 대부분의 경우 표본조사가 일반적으로 사용됩니다.
기술통계와 추론통계
모집단 전체 데이터를 수집했다면, 우리는 모수를 알아내기 위해 데이터를 정리하고 요약하면 됩니다. 이를 기술통계라고 합니다.
반면, 표본만을 가지고 있다면, 표본을 바탕으로 모집단의 특성을 예측하거나 추론해야 합니다. 이러한 과정을 추론통계라 합니다.
이때 표본에 포함된 요소의 개수를 표본크기라고 하는데 추론통계에서 중요한 영향을 미칩니다. 표본의 크기가 충분히 크지 않다면 모집단의 특성을 정확히 추정하기 어려울 수 있습니다.
예를 들어, 10명을 뽑아 한국의 평균 키를 추정하는 것보다 1000명을 뽑아 추정하는 경우 더 신뢰할 수 있는 결과를 얻을 가능성이 높을 것입니다. 표본의 크기가 클수록 모집단을 더 잘 대표할 가능성이 높습니다. 따라서 통계 분석에서 표본크기는 중요한 요소 중 하나로 간주됩니다.
해당 페이지는 다음 자료들을 참고해서 작성하였습니다.
- 통계101x데이터 분석(아베 마사토)
- 통계학 : 파이썬을 이용한 분석 (인하대학교 통계학과)
'학습 > 통계학' 카테고리의 다른 글
5. 두 변수의 관계 파악하기 (0) | 2025.01.15 |
---|---|
4. 데이터의 경향 파악하기 - 그래프 그리기 (0) | 2025.01.15 |
3. 데이터의 경향 파악하기 - 수치로 요약하기 (0) | 2025.01.15 |
2. 데이터의 유형 (0) | 2025.01.11 |