Intro. Stochastic Process

Benjamin S. Kim
Epopcon Data Science & Engineering
3 min readJun 22, 2018

Deterministic World : Real Number
Stochastic World : Random Variable, Random Function
* Random Variable(RV) : Sample space → Real Number
* Random Function : Sample space ⊙Time → Real Number

실험/시도/현상에 대한 결과물들이 모두 나열된 sample space의 세계는 추상화된 집합의 세계이다. (여기서 추상화란 숫자로 표현되지 않은 것까지 모두 포함한 논리적 영역이라 생각하면 좋겠다). 우리는 현실을 숫자로 바꿔 다뤄보고 싶다. 그래서 필요한 것이 RV이며, RV는 집합을 숫자로 매핑해주는 함수이다. Random Function는 RV의 확장된 버전의 함수라고 이해하면 쉽다. 자세히 풀어쓰자면 sample space가 time 의 영역과 교차되는 큰 영역을 수의 세계로 매핑해주는 함수이다. 여기서 매핑시킨 숫자가 1차원이냐 다차원이냐에 따라 붙이는 이름이 다른데 앞으로 배울 Stochastic Process는 1차원에 해당한다. 이안에서도 시간유형이 이산형인지 연속형인지에 따라 구분지어 명명한다.

Random Function
1) 1-dimension : Random Process (or Stochastic Process)
* Time type에 따라 Discrete / Continuous 으로 나뉜다.
2) Multi-dimension : Random Field

시간이 지남에 따라 발생하는 사건들이 랜덤하다면, 특히 사건들을 1차원으로 표현할 수 있다면 Stochastic Process 모델로 설명가능하다. Counting Process ; N(t)을 통해 이해해 보자.

Def. of Counting Process ; N(t)

N(t) = the total number of ‘events’ that have occurred up to time t (t>0)

i) N(t) ≥ 0
ii) N(t) 는 integer 값이다.
iii) If s < t , then N(s) ≤ N(t)
iv) For s < t, N(t)-N(s)는 (s,t]안에서 발생한 events의 수이다.

Xi : positive inter-arrival time between (i-1)th event and ith event
Sn
= X1+X2+ … + Xn : the time of the nth events

Counting process ; N(t)

은행직원이 일주일동안 방문고객을 세야 하는 업무가 있다고 하자. 직원은 매일 아침부터 시계를 보면서 방문하는 고객을 센다. 아침 개장시점기준 30분이 지난 시간까지 10명이 방문했고 단위시간이 분단위라면 N(30) = 10이고 S(10)=30이다. 정리하면 N(t)은 특정단위시간기준 사건발생건수, Xi은 단위사건기준 소요시간 그리고 Sn은 특정발생건수기준 소요시간이다. 여기서 같은 내용을 보는 관점에 따라 다양하게 표현하고 있음을 기억하자. (깊게 배울수록 복잡해지는 수식을 견뎌내기 위해 기본 개념을 단디 알아야 한다.) Counting Process에 아래의 조건이 추가되면 Renewal Process이 된다.

Def. of Renewal Process ; N(t)

v) independent identically distributed(iid) Xn with a common distribution F

μ = E[Xn], n≥1 ;
모든 Xn이 서로 같은 분포(같은 parameters)를 가진다.

앞서 Stochastic Process(이하 SP)는 Time의 type에 따라 다른 모형이 존재할 수 있다고 했다. (물론 Discrete Time에 infinity를 취하면 Continuous Time과 동일함).

  1. Discrete Time N(t) ; Bernoulli Process(이하 BP)

Def: a sequence of Yi is Bernoulli Process if it is independent Bernoulli trials
At each trial, i
P(success) = P(Yi = 1) = p
P(failure) = P(Yi = 0) = 1 - p

단위시간에서 결과물이 두가지 경우만 나오며 성공확률을 p라고 할 때, 해당 확률과정을 베르누이 과정이라 정의한다. 그러면 Renewal Process의 N(t)가 Binomial PMF를 따르고 inter-arrival time(Xi)의 분포가 geometric 분포를 따른다. 쉽게 말해, 베르누이시행처럼 두가지 결과물만을 가진다는 조건이 추가된 Renewal Process에서 Xi가 기하분포를 따른다. N(t)와 Xi의 분포를 알았으니 Sn의 분포도 알 수 있다. Xi가 independent 이면서 same geometric 분포를 가지고 있기 때문에 쉽게 구할 수 있다. Sn의 분포를 Pascal PMF라고 부른다.

2. Continuous Time N(t) ; Poisson Process

Def: a sequence of Yi is Poisson Process if it satisfies this three conditions that
1) Time homogeneity
2) Independence
3) Small interval probabilities

나중에 자세히 다룰 것이기에 위의 내용을 요약하면 inter-arrival time(Xi)의 분포가 exponential 분포를 따를 경우, Poisson Process라고 한다.

이산형과 연속형 유형마다 각각 대표적인 SP인 Bernoulli/Poisson Process를 보면, 두 개의 Process가 동일하게 Memoryless 특성(Markov property)을 가진다. Markov property속성이 있는 Process를 가리켜 Markov Process이라 하는데 앞으로 자세히 다룰 예정이다.

Markov Chain : “a stochastic model describing a sequence of possible events in which the probability of each event depends only on the state attained in the previous event”.
Markov Process : “a stochastic process that satisfies the Markov property in probability theory and related fields”
Markov property : the memoryless property of a stochastic process. if the conditional probability distribution of future states of the process (conditional on both past and present states) depends only upon the present state, not on the sequence of events that preceded it.

--

--