GC Jeong
GC Jeong
Sep 18, 2018 · 3 min read

#library(ggplot2)

#library(gcookbook) 예제 포함

library(gcookbook)

clim <- subset(climate, Source == “Berkeley”,select=c(“Year”, “Anomaly10y”, “Unc10y”))

subset은 필터 같은 역할을 한다. 여기서는 Source == “Berkeley”인 것을 가져오고,

변수는 select=c(“Year”, “Anomaly10y”,”Unc10y”)만을 가져와라 하고 명령한 것이다.

clim을 살펴보자

head(clim)

Year Anomaly10y Unc10y
1 1800 -0.435 0.505
2 1801 -0.453 0.493
3 1802 -0.460 0.486
4 1803 -0.493 0.489
5 1804 -0.536 0.483
6 1805 -0.541 0.475

대략 이렇게 생긴 데이터 셋이다.

Anomaly10y는 10년간의 기온의 편차의 평균치이고, Unc10y가 95%신뢰구간에 해당하는 값이다.

따라서 이 두 변수를 가지고 음역지역을 나타냄으로써 신뢰구간을 그래프로 표현해보자.

ggplot(clim, aes(x=Year, y=Anomaly10y)) +
geom_ribbon(aes(ymin=Anomaly10y-Unc10y, ymax=Anomaly10y+Unc10y),alpha=0.2)+

geom_line()

geom_ribbon을 사용해서 line주변에 음역지역을 표시했다.

신뢰구간은 평균 — 신뢰구간의 해당하는 값, 평균 + 신뢰구간의 해당하는 값, 이기 때문에

geom_ribbon안에 ymax와 ymin의 값을 위의 코드처럼 주어 영역을 설정하였다. alpha=0.2는 음역의 투명도를 조절 한다.

이번에는 geom_line()을 중복 시켜서 신뢰구간을 점선으로 표시해보자.

ggplot(clim, aes(x=Year, y=Anomaly10y)) +
geom_line(aes(y=Anomaly10y-Unc10y), colour=”grey50", linetype=”dotted”) +
geom_line(aes(y=Anomaly10y+Unc10y), colour=”grey50", linetype=”dotted”) +
geom_line()

geom_line()별로 y값 매칭을 다르게 설정해서 실선 옆으로 점선을 형성하였다.

geom_line()안에 linerype=”dotted”를 지정해서 선 타입을 점선으로 바꾸었을 뿐이다.

신나는연구소

신나는 일을 하며 삽시다!

GC Jeong

Written by

GC Jeong

#Data Analyst #세상을 보는 데이터 분석가 #책을 읽는 몽상가

신나는연구소

신나는 일을 하며 삽시다!

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade