측도론으로 정의되는 디락 측도와 이산 확률 분포 Dirac Measure and Discrete Probability Distribution

통계학/확률론|2019.09.20 10:54


기초적인 확률론에서 확률 분포란 이산과 연속 둘 중 하나였고, 그 설명도 다소 직관을 동원할 수밖에 없었다. 그러나 측도론을 도입하면 수학적인 모호함 없이 깔끔하게 이산 확률 분포를 정의할 수 있다.



확률 공간 $( \Omega , \mathcal{F} , P)$ 이 주어져 있다고 하자.


Step 1. 확률 변수 $X$ 가 단 하나의 값을 가지는 경우

$X = a$  인 경우만 있다고 생각할 때, 그 확률 분포 $P_{X}$ 를 디락 측도 $\delta_{a}$ 라고 한다.

$$P_{X} (B) = \delta_{a} (B) := \begin{cases} 1 &, a \in B \\ 0 &, a \notin B \end{cases}$$

보다시피, 확률 분포 $P_{X}$ 는 보렐 셋 $B \in \mathcal{B} ( \mathbb{R} )$ 에 $a$ 가 포함되느냐 포함되지 않느냐의 둘 중 하나만을 신경쓴다. 이는 이산과 연속의 차이점을 파악함으로써 확률 분포의 유형을 이해하는 것과 본질적으로 큰 차이가 있다. 물론 측도론으로 확률 분포를 새롭게 정의한다고 하더라도 (절대) 연속 확률 분포나 이산 확률 분포라는 단어를 쓸 수 없게 되는 것은 아니다. 하지만 이 둘은 결국 같은 확률 분포며, 같은 방식으로 정의되지만 다른 성질을 가진 것에 불과하게 되는 것이다.


Step 2. 확률 변수 $X$ 가 두 개의 가지는 경우

확률 $p$ 로 $X = a$ 이면서 확률 $(1-p)$ 로 $X = b$ 인 확률 변수를 생각해보자. $X$ 는 Step 1.의 디락 메져를 이용해서 그 확률 분포를 다음과 같이 나타낼 수 있다.

$$P_{X} (B) = p \delta_{a} (B) + (1-p) \delta_{b} (B)$$

보기 쉽게 풀어내보면

$$P_{X} (B) = \begin{cases} 1 &, a,b \in B \\ p &, a \in B \land b \notin B \\ 1-p &, a \notin B \land b \in B \\ 0 &, \text{otherwise}\end{cases}$$

이와 같은 전개에 따라 이산 확률 분포의 일반적인 폼을 생각할 수 있을 것이다.


Step 3. 일반적인 이산 확률 분포 $X$

$i \in \mathbb{N}$ 에 대해 $p_{i} > 0$ 이고 $\sum_{i} p_{i} = 1$ 이면 다음과 같은 확률 분포 $P_{X}$ 를 생각할 수 있다.

$$P_{X} (B) = \sum_{i \in \mathbb{N}} p_{i} \delta_{a_{i}} (B) $$


어쩌면 이렇게 새로운 정의가 낯설고 직관적이지 않다고 생각할 수도 있겠지만, 오히려 그 '직관적이지 않은' 점이야말로 측도론을 도입하는 이유라고도 할 수 있겠다. 기왕 측도론까지 동원된 확률론에 손을 댔다면 가능한 빨리 이러한 표현에 익숙해지는 것이 좋다.



한편 이산 확률 분포를 정의하기 위해 디락 메져가 필요했을 뿐, 디락 측도를 쓰면 이산 확률 분포인 것만은 아니다. 앞서 언급했듯 측도론을 도입해도 연속 확률 분포와 이산 확률 분포가 있기는 하다. 하지만 디락 메져 역시 그닥 특별할 것 없는 르벡 메져에 지나지 않으므로 이를 어떻게 쓰는지는 순전히 우리의 자유에 달린 것이다. 다음의 예시를 생각해보자 :


Q. 도시 $A$ 에서 $B$ 까지 50km 떨어져있다고 하자. $A$ 에서 $B$ 까지 시속 100km/h로만 갈 수 있는 차를 타고 가야하는데, 출발 시각은 1시부터 2시 사이에 균등분포로써 랜덤으로 정해진다. 물론 1시 이전에 $B$ 에 도착하면 차는 주차할 수 있다. 그렇다면 2시 정각이 되었을 때 차와 $B$ 사이의 거리는 어떤 확률 분포를 따를까?


A. 우선 출발 시각이 1시 30분 이전이라면 $B$ 에 미리 도착해서 주차할 수 있을 것이다. 그러나 1시 $t > 30$ 분에 출발했다면 늦게 출발한만큼 $B$ 와 멀리 떨어져 있을 것이다. 이를 확률변수로 나타내보면 다음과 같다.

$$X(t) = \begin{cases} 0 &, t \in [0,30] \\ \left| 50 - 100 {{t} \over {60}} \right| &, t \in (30, 60] \end{cases}$$

그렇다면 그 확률 분포는 다음과 같이 디락 메져 $\delta$ 와 유니폼 메져 $m$ 을 써서 표현된다.

$$P_{X} = {{1} \over {2}} \delta_{0} + {{1} \over {2}} \cdot {{1} \over {50}} m_{[ 0, 50]} $$


보다시피 예시에서 $P_{X}$ 는 이산 확률 분포도, 연속 확률 분포도 아니다.