Relative Risk (상대위험도)와 Odds Ratio (오즈비) 개념과 예시

kiana
5 min readNov 30, 2019

--

Odds ratio 란 무엇인가?

Odds Ratio (OR) 는 odds 의 ‘비율’이다. Odds 는 성공과 실패의 비율이다. 스포츠 경기에서 다음과 같은 표를 볼 수 있는데, 오른쪽 열의 ODDS TO WIN 을 보면 9–2, 5–1 등의 형태로 표현이 되어있다. 우승 확률이 9대 2다, 5대 1이다 의 의미는 전체 11가지 경우 중 2번 이길 수 있다, 전체 6가지 경우 중 1번 이길 수 있다는 뜻이다.

Photo by JESHOOTS.COM on Unsplash
https://www.espn.com/chalk/story/_/id/20991480/soccer-odds-win-2018-fifa-world-cup

probability (확률) 과 odds 는 유사한 개념이라 이 둘을 비교하자면,
전체 10가지 경우 중 1번 이길 경우를 probability로 표현하면 0.1, odds로 표현한다면 9–1 이 된다.

Odds ratio는 아래와 같은 식으로 표현할 수 있다.

다시 말해서, 우승할 확률을 우승하지 못할 확률로 나누는 것이 odds 이다.

앞서 말했듯이 Odds Ratio 는 odds의 비율이다. 흡연자가 폐암에 걸릴 확률이 20%, 비흡연자가 폐암에 걸릴 확률이 1%라 가정해보자. 이 경우, 흡연자가 폐암에 걸릴 odds 는 20/80 = 1/4 = 0.25 이며 비흡연자가 폐암에 걸릴 odds 는 1/99 = 0.0101 이다. 이를 조건부 확률로 아래와 같이 표현할 수 있다.

즉, 분모는 흡연을 한 사람이 병에 걸릴 odds, 분자는 흡연을 하지 않는 사람이 병에 걸릴 odds 이다. 위 예시에서 smoking의 disease에 대한 Odds Ratio 는 0.25/0.0101 = 24.75 인데 이 숫자를 직관적으로 해석하기란 어렵다. (흡연자가 비흡연자에 비해 24.75배 만큼 질병에 걸릴 확률이 높다는 것을 의미하는 것이 절대 아니다!) Relative Risk는 OR에 비해 직관적으로 이해할 수 있으므로 논문에서도 OR 보다는 RR 을 싣는 경우가 많다.

Relative Risk란 무엇인가?

Relative Risk (RR) 이란 Risk의 비율을 의미한다. 다시 말해서 위험 인자가 있는 경우 어떤 사건이 발생활 확률이, 위험 인자가 없는 경우 사건이 발생할 확률의 비를 의미한다.

위 흡연자와 비흡연자의 폐암에 걸릴 확률에 대해서, 흡연자의 폐암에 대한 RR은 P(event when exposed) / P(event when not exposed) = (20/100)/(1/100) = 20 이 된다.

Odds Ratio 와 Relative Risk 를 비교해보자

네덜란드 헤이그의 1972–1981년 설문조사 결과에 따르면, 애완용 새를 기르는 것이 폐암에 걸리는 것과 관련이 있다고 한다. Birdkeeping 을 위험 인자로 했을 때, 다음과 같은 결과표를 얻을 수 있다.

위 표의 BKBird (0=non-bird keeper, 1=bird keeper) 를 해석해보자. 다른 모든 predictor 이 일정할 때, x값이 1 증가하면 결과가 어떻게 되는지 알아보자.

x값이 0일 때(non-bird keeper)과 1일 때(bird keeper)의 값의 차는 -0.0665이다. Logistic Regression에서 log를 없애기 위해 계산을 하면 새를 키우는 사람의 cancer 에 대한 Odds Ratio 는3.91이 나온다.

이번에는 P(cancer | no birds) = 0.05 이라고 주어질 때, 새를 키우는 사람이 폐암에 걸리는 사건에 대한 RR를 구해보자.

birds와 cancer에 대한 조건부 확률을 구하기 위해 다음과 같이 도식화를 할 수 있다. 위의 식을 통해 P(cancer | birds) 가 0.171임을 알 수 있다.

Relative Risk
= P(cancer | birds) / P(cancer | no birds)
= 0.171 / 0.05 = 3.42 이다.

이 값을 통해서 bird 와 cancer 예시를 통해서 OR Curve를 그릴 수 있다.

이는 non-bird keeper 가 폐암에 걸릴 확률(OR의 분모)을 x 축, bird keeper 가 폐암에 걸릴 확률(OR의 분자)을 y축으로 두었을 때 발생가능한 경우를 함로 표현한 것이다. 이전 문제에서는 P(cancer | no birds)가 0.05 라고 주어졌기 때문에 값을 하나로 구할 수 있었다. 하지만 이 값이 주어지지 않았을 때 발생할 수 있는 모든 경우를, x값 (P(cancer|nobirds)이 변함에 따라 y값이 변하는 함수로 표현할 수 있으며 이를 나타낸 것이 OR Curve이다.

--

--