Daily Report Project — 기획

미완성의 신
3 min readNov 13, 2019

--

올해 초 부터 crontab의 존재에 대해 알게 되었고, 이를 사용해보려 했으나 번번히 실패 했다. 그러나 9월쯤인가? 절대 경로라는걸 알게 되면서 crontab를 사용할 수 있게 되었고, 동시에 이를 어떻게 사용 할 수 있을까? 라는 생각을 했다. 그래 매일같이 새로운 분석을 해보자. 컨셉은 다음과 같다.

오늘 주요 뉴스와 키워드, 그리고 내가 무엇을 입을지 알려줘

그렇게 시작한게 이번 Daily Project다. 리눅스의 crontab뿐만 아니라 R에서 Rmd로의 렌더링, bash 스크립트 등등 그리고 카카오톡 api 까지 연동 까지 많은 내용이 있기에 내용은 나누어서 적어보도록 하겠다. 글을 쓰는 순서는 의미를 두지 않고, 목차만 잘 정리 해놓은 상태로 하나씩 적는것이 목표이다.

1. WSL에 대해 알아보자.(링크첨부)

기존에 aws ec2를 사용하고 있는데, 이 서버를 매일 같이 돌리기에는 금전적으로 많은 무리가 있다. 그렇기에 wsl을 사용할 예정이다.

2. Scheduler 에 대해 알아보자(링크첨부)

이번 프로젝트의 핵심이자 위 사진의 빨간 부분에 해당 하는 부분이다.

3. R 에서 Rmd를 호출 하자(링크 첨부)

위 빨간 부분에 해당하는 내용이다. Rmd에서 html 혹은 pdf를 생성 하지 않고 R에서 생성하도록 유도 하여 동시에 생성된 html, pdf 의 파일명도 컨트롤이 가능하다.

4. Rmd에서의 본격적인 데이터 분석

rmarkdown에서 데이터 분석이 이루어진다. 아직 초안이지만 현재로서는

  • 네이버 뉴스 속보를 가져와, 워드 클라우드와 네트워크 분석
  • 네이버 날씨 데이터를 가져와 무엇을 입어야 할지 추천

5. 파이썬을 사용한 카카오톡봇 만들기

이제 매일아침 만든 보고서는 나에게 직접 전송이 이루어져야 한다. 이는 파이썬을 사용하여 카카오톡봇을 만들어 볼 것이다.

--

--

미완성의 신

우리 인간은 미완성의 신들이다. 뛰어난 데이터 과학자를 꿈꾸는. 책을 좋아하는. 그런 사람입니다.