Redash 線上體驗

Mars Weng
MarsW-Redash
Published in
5 min readOct 12, 2018

--

Superset 雖然極為彈性,但不甚理想的使用方式還是沒能讓我滿意,
但 Metabase 總覺得還是少了些彈性,讓我不太能完全放心決定以他當成我們的系統。

在比較 Superset 與 Metabase 的時候,找到了此篇文章
發現了一個新的服務 Redash ,就也來體驗看看。

有別於 Metabase 、 Superset 都需要自行架設環境,
Redash 有提供線上的服務,可以先行免費體驗,
決定是直接使用它們的付費方案或是自行架設管理環境。

先到 Redash 的官網 https://redash.io/
Get Started > 註冊自己的正式帳號,
但是不像是 Metabase 或 Superset,新手上路有現成的 Dataset 可以先行把玩,需要自己新增相關的 Datasource。

Redash 沒有現成的 Dataset 可以先行體驗

如果想要查看相關 Example ,是要到 http://demo.redash.io/
不過此處的 demo 帳號與 https://redash.io/ 註冊的正式帳號是不互通的,
因此需要你透過 Google 帳號登入註冊(也沒有其他的註冊方式)。

demo 站的好處是有現成 example 可以參考,
看各種圖表以 SQL 該怎麼寫或是一些進階功能,
但就無法像正式站有全部的權限可以新增自己的 Datasource 或是進階管理,此外 query 的速度也異常緩慢,建議當參考就好,而不要直接在裡面操作。

先串接NBA的MySQL Database來試試https://relational.fit.cvut.cz/dataset/NBA

赫然發現Redahs支援的 Datasource 又默默增加了一些(詳細列表)
(自架的話有支援Python!)

在 Redash 之中,是以 Query 作為主軸,與 Metabase 相近的是先透過 Query 以 SQL 語法撈取所想要的資料,再進行視覺化;但和 Metabase 不同之處是,一個 Query 可以對應很多個不同的 Visualization,這點滿對我的胃口:不會有太多一樣的 Query 結果,只是為了對應不同的圖表。

同樣能 Download Dataset 或是以 HTML 方式嵌入

在資料的處理上面,也是以原本的資料型別為基礎,並沒有再進行加工,
雖然不及 Superset 有極為豐富的圖表,但還是比 Metabase 多樣,還有不少是我還沒使用過的類型:Cohort, Sankey, Sunburst Sequence,後續系列也會去體驗看看。

在 Chart 圖表中,還可以針對Y軸不同資料給予不同的視覺化方式 eg. Line + Bar or Scatter

而 Visualization 中最令我驚豔的是 Pivot Table,
之前完全沒使用過樞紐分析表,也算是自己的初體驗:
不用先想好要檢視的角度在 SQL 下Group by 語法,
就可以直接針對所撈取的所有資料以此種視覺化互動方式來檢視,
也算是某種層面降低了技術需求。

Dashboard 比起 Superset、Metabase 就少了些彈性,Redash 是直接每個 Visualization 相連,因此不能很細緻的去調整每個的位置。

總結

[優點]

  • Visualization 是跟著 Query 的,因此在要重新調整 Query 的時候只需要調整一次,所有相關圖表都會自行更新
  • 支援很多種類的 Datasource
  • 有 Pivot-Table 可以讓非技術人員也能很容易以各種不同角度檢視資料
  • 有支援 Python,如果是比較複雜的資料用 SQL 串起來可能會比較麻煩,有多一條路能用自己最上手的 Python 開發起來會順暢很多

[缺點]

  • 非技術人員如果沒有 SQL 背景,只能透過已經撈好的資料進行操作
  • 將撈好的資料進行 Visualization 大多需要自行設定 X,Y 軸資料類別,
    幾乎無先行智慧型判斷
  • 第一次使用沒有既有的 Sample 可供參考,需要去翻官網文件,
    但官網文件的詳細層度也不比 Metabase,
    多少還需要翻討論區或是另行 Google。

此為系列文章,傳送門在此

--

--