확률변수와 확률분포
확률변수란, 확률실험(ϵ)의 표본공간(Ω)에서 정의되는 함수이다. X:Ω →R을 Ω공간에서 정의되는 확률변수라고 부른다. 함수이기 때문에 정의역, 공역, 치역이 존재한다.
동전을 2개 던져서 앞면이 나올 확률사건이 있다. 정의역은 표본공간(Ω)으로 (H,H),(H,T),(T,H),(T,T)이다. 공역은 실수전체 집합이고, 치역은 (0,1,2)이다.
확률분포함수
확률변수를 일직선 상 공간에 표현한 것이 확률분표 함수이다. 확률변수(X)에가 확률공간(Ω,F,P)에 정의된 확률변수 일때, 확률분포 F(X)는 다음과 같이 정의한다.

확률변수 X의 확률분포함수는 확률사건 x이하의 모든 확률의 누적값이다. “왜 ‘a<X≤b’의 방식으로 표현하지 않는가?” 라는 질문을 할 수 있다. 하지만 수학자들은 통상적인 확률변수(이산,연속…. )를 정의할때, 누적값이 보다 합리적이라고 판단을 하여서 이렇게 정한 것이다. 이산확률변수일때와 연속확률변수일때 조건값이 조금 다르게 적용이된다.
앞선 동전 2개를 던져서 앞면이 나올 확률사전을 다시 한번 살펴보자.
- P(X≤0): 1/4(앞면이 0번 나올확률)
- P(X≤1): 3/4(앞면이 0번 나올 확률 + 나올 확률)
- P(X≤2): 1
이러한 확률분포함수는 3가지 특징을 가진다.
- 비감소성: 누적함수이기 때문에 a<b 이면 F(a)<F(b)이다.
- 극한성: 확률함수이기 때문에 최소극한값은 0이고, 최대극한값은 1이다.
- 우방연속성: 누적함수이기 때문에 함수그래프 상으로 오른쪽(+쪽)으로는 연속성을 갔는다. 식으로 표현하면 다음과 같다.

아까 말한 동전의 예를 들어보자. (x≤1)의 값은 3/4이다. 동전의 앞면이 (x≤1+0.0000001) 번 나올 확률은 3/4이다. 하지만 (x≤1- 0.0000001)의 값은 1/4이다. 특정 작은 값 ϵ이 더해졌을 경우에는 값의 변동이 없지만, 뺄셈을 할 경우에는 값은 변동이 있다는 특징을 가진다.
확률질량함수와 확률밀도함수
확률질량함수 (PMF, Probability Mass Function)란 확률변수가 이산확률변수일때 사용되고 식은 다음과 같다. 이산확률변수인 만큼 값을 특정지을 수 있다.

확률밀도함수(PDF, Probability Density Function)란 확률변수가 연속적을 때 사용된다. 연속확률변수이니 만큼 공간을 적분을 해서 구해야 한다.

확률밀도에서 다음과 같은 질문이 나올 수 있다. 누적 값이 아는 특정 구간 P(a<x≤b)일 때는 어떻게 해야 할까? 뺄셈을 하면 된다.

위 글은 ‘실용이야기와 함께하는 확률과 통계(김해경, 박경욱 저, 경문사)’를 참고하여서 쓰여졌습니다.