如何溝通資料:輕量級標記式語言

使用 Markdown 協助寫作文字敘述

Yao-Jen Kuo
數聚點文摘

--

Photo by Alex Litvin on Unsplash

If you can’t explain it simply, you don’t understand it well enough.

Albert Einstein

經過如何獲取資料如何掌控資料如何探索資料以及如何預測資料,我們已經掌握將資料導入 Python 與 R 的分析環境,利用撰寫程式整理成符合分析所需的樣式,通過視覺化探索資料的特徵,還有使用機器學習對未知資料進行數值或分類標籤的預測等技巧。接下來資料科學專案僅剩下最後一哩路,也就是向其他團隊的成員解釋專案中的發現,如果能夠有效地向合作部門(像是產品、行銷與管理團隊等)精準地傳達分析結果,將能顯著為資料科學專案的成果加值,提升資料科學團隊在組織內的價值。

如何溝通資料的系列文章主要探討能協助團隊傳達資料科學分析專案的技術以及工具,如何透過它們幫助一個對於專案毫無涉獵的人,快速且輕鬆地了解專案發現了哪些有趣且有價值的事情。

摘要

本文涵蓋 Markdown 簡介、常用的 Markdown 語法、如何結合 Markdown 文字、程式與圖形於 Jupyter Notebook 和 RMarkdown 之間、應用 GitHub 與 GitLab 分享呈現 Jupyter Notebook 以及應用 GitHub Pages 與 GitLab Pages 分享呈現 RMarkdown 所輸出的 HTML 格式。

Markdown 簡介

從 GitHub 上的讀我檔案(README.md)、Jupyter Notebook 的文字儲存格、RMarkdown 的文字區塊到靜態網站產生器(Static Site Generator)的文字檔案,Markdown 逐漸成為現代軟體開發者以及資料科學團隊必備的輕量標記語言,透過 Markdown 語法讓我們能夠撰寫易於閱讀、撰寫的純文字,並透過像是 pandoc 的轉換器選擇性地輸出多樣格式(如 HTML、Word 或者 PDF。)

現代資料科學團隊大量使用 Jupyter Notebook 與 RMarkdown 作為整合文字敘述、程式碼、執行結果與視覺化的工具,其文字敘述的部分就是以 Markdown 語法為主。團隊內部的溝通常以筆記本模式進行,而與合作部門的決策者溝通時則採用報告模式。我們只需維護一個 .ipynb(Jupyter Notebook 文件的副檔名,意即 Interactive Python Notebook)或一個 .Rmd(RMarkdown 文件的副檔名),並透過調整終端機輸出指令或者 YAML 格式,就可以將純文字檔案轉換為筆記本模式以及報告模式。

常用的 Markdown 語法

--

--