susinlee 님의 블로그

6. 확률 본문

학습/통계학

6. 확률

susinlee 2025. 1. 16. 01:25

확률론의 중요성

 

이번 장에서는 확률론에 대해 알아봅니다. 통계학을 배우기에 앞서 확률론을 먼저 학습해야 하는 이유는, 추론 통계가 확률 이론을 기반으로 하기 때문입니다. 예를 들어, 추론 통계에서는 표본모집단이라는 확률분포에서 확률적으로 추출된 개체로 가정합니다. 

표본은 모집단이라는 확률분포에서 샘플링한 데이터라고 가정

 

따라서 확률론은 통계학의 기초이자, 데이터를 분석하고 해석하는 데 있어 필수적인 도구입니다.


확률

 

확률론은 무작위 현상을 분석하고 설명하기 위한 수학적 체계입니다. 여기서 확률이란 불확실한 사건이 발생할 가능성을 수치로 표현한 값을 의미합니다. 불확실한 사건이란, 예를 들어 동전 던지기처럼 앞면이 나올 수도 있고, 뒷면이 나올 수도 있는 결과가 일정하지 않은 실험이나 관측 상황을 말합니다. 이러한 확률을 계산하기 위해서는 실험의 결과를 체계적으로 표현할 필요가 있습니다. 이를 위해 다음의 용어들을 알아보겠습니다.


1. 표본공간

표본공간은 우리가 다룰 실험에서 발생 가능한 모든 결과들의 집합을 말합니다. 쉽게 말해, "어떤 일이 벌어질 수 있는 모든 경우"를 한데 모아놓은 리스트라고 생각하면 됩니다. 이를 S로 표현합니다.

 

아래 예시를 살펴보겠습니다.

  • 동전 던지기를 한다면 결과는 앞면과 뒷면, 딱 두 가지입니다. 이때 표본공간 S는 {앞면, 뒷면} 이 됩니다.
  • 주사위를 굴리면 나올 수 있는 숫자는 1, 2, 3, 4, 5, 6 입니다. 그래서 이 실험의 표본공간  S는 {1, 2, 3, 4, 5,

2. 근원사건

근원사건은 실험에서 벌어질 수 있는 개개의 결과를 말합니다.

 

아래 예시를 살펴봅시다.

  • 동전 던지기에서 '앞면' 또는 '뒷면' 은 각각 근원사건입니다.
  • 주사위를 던지기에서 '3' 이 나왔다면 이 역시도 근원사건입니다.

모든 근원사건은 표본공간의 일부입니다. 주사위의 경우 1, 2, 3, 4, 5, 6 각각이 근원사건입니다. 


3. 사건 

사건은 표본공간 안에 있는 여러 결과들의 집합입니다. 다시 말해, 특정 조건을 만족하는 근원사건들의 집합입니다. 사건은 하나의 근원사건으로만 이루어질 수도 있고, 여러 근원사건이 모여서 만들어질 수도 있습니다.

 

아래는 예시입니다.

  • 주사위를 던졌을 때 "짝수가 나오는 사건"은 2, 4, 6 입니다. 짝수가 나오는 사건을 A라고 한다면 A = {2, 4, 6} 으로 표현할 수 있습니다.
  • 동전 두 개를 던졌을 때 "적어도 하나가 앞면인 사건"을 B라고 했을 때 B = {HH, HT, TH} 로 표현할 수 있습니다. 여기서 표본공간은 {HH, HT, TH, TT} 입니다.

사건은 우리가 초점을 맞추는 부분이라고 볼 수 있습니다.


사건의 확률 

사건의 확률이란, 동일한 조건에서 하나의 실험을 반복할 때, 전체 실험 중 특정 사건이 발생하는 비율을 뜻합니다. 사건 A라고 하면, 사건 A의 확률은 Probability의 첫 글자인 P를 따와 P(A)로 표현합니다. 예를들어, 사건 를 주사위에서 1이 나오는 경우로 정의하면, 사건 의 확률 P(A)는 실험을 무수히 반복했을 때 전체 실험 횟수 중에서 1이 나온 횟수의 비율로 나타낼 수 있습니다.

실험을 반복했을 때 사건이 발생한 횟수의 비율

 


확률의 계산

사건의 확률을 계산하는 방법은 크게 두 가지가 있습니다. 하나는 앞서 주사위를 던질 때처럼 모든 면이 나올 가능성이 동일한 경우에 1의 눈이 나오는 사건의 확률을 구할 때 쓰이는 방법이고, 다른 하나는 어떠한 특성을 가진 주식이 내일 오를 확률을 구할 때 쓰이는 방법입니다. 

 

방법 1. 표본공간 S가 k 개의 원소로 이루어져 있고, 각 근원사건이 일어날 가능성이 동일하다고 할 때, 근원 사건 중 하나가 일어날 확률은 1/k 로 주어집니다. 사건 A가  m 개의 근원사건으로 이루어져 있다면 사건 A가 일어날 확률은 다음과 같습니다.

 

방법 2. 동일한 실험을 n번 반복했을 때 사건 a의 상대도수를 확률값으로 사용합니다.


확률의 특징

확률률은 전체 중 특정 사건이 발생하는 비율을 나타내므로,  P(A)의 값은 항상 0 에서 1 사이를 가집니다. 또한 하나의 실험에서 가능한 모든 사건의 확률을 더한 값은 항상 1이 됩니다. 

 

사건 A가 일어나려면, A에 속하는 근원사건 중 하나가 발생해야 합니다. 따라서 사건 A의 확률은 A에 속하는 근원사건 각각의 확률을 모두 더한 값이 됩니다. 예를 들어, 주사위 던지기에서 사건 A를 '홀수 눈이 나오는 사건' 이라고 가정해봅시다. 사건 A의 근원사건은 {1, 3, 5} 가 되고, 주사위의 각 눈이 나올 확률이 1/6 이라면 사건 A가 발생할 확률은1/6 + 1/6 + 1/6로 3/6 = 1/2 이 됩니다.