[雲端除魅化 1] AWS Certified Data Analytics — Specialty (DAS)

HFC
7 min readMar 19, 2023

--

目錄

DAS 除魅化

近幾年來 Tableau/PowerBI 等等的 BI 工具跟隨著 Data-driven 的熱潮越來越盛行而逐漸成為顯學,各式酷炫的 Dashboard、視覺化呈現也就應運而生。而這也是大部分的同學對於所謂「數據驅動」的理解。

然而,再酷炫的 Dashboard 都需要優質的資料源才能夠產生精準的 Business insights,有做過簡單的 Excel 資料分析的你或許也理解資料匯總、清理、整理的重要性。在面對越來越龐大的數據時,對資料的自動化處理也就越來越重要。

也因此工程師發展了一系列工具/機制,來對於資料的「收、傳、算、用」 (收取、傳送、計算、場景運用) 進行自動化,但往往都需要複雜的設定以及調教。在雲端的世界中,公有雲業者 (e.g. AWS, GCP, Azure…) 將這些複雜的機制進行包裝及簡化,讓所有人都能夠以更簡單易懂的方式去運用這些工具/機制。

AWS DAS 證照,正是 Focus 在這樣的領域,讓你去使用 AWS 提供的資料處理服務解決商業中常見的數據分析問題。

Snapshot of DAS:

  1. DAS 是一張雲端 infrastructure 的證照,如果你要找的是「商業分析」的證照,請右轉去找 Excel/Tableau/PowerBI 相關證照
  2. DAS 並不適合雲端小白,請至少考完 AWS Certified Solutions Architect — Associate 證照再來,不然你的頭會很痛
  3. DAS 能夠教會你在業界常用的數據處理手法 (Apache 基金會動物園系列XD),同時也讓你認識 AWS 關於數據分析的相關服務
  4. DAS 關注「商業需求」,你必須依據題目給出的限制來架構出符合需求Data Pipeline/infrastructure (e.g. Real-time 數據反應、有限的預算、與現行架構的配適性等)

上人權圖

DAS 證照簡介:

AWS Certification 官網資訊

DAS 屬於 AWS 證照中的專家級證照,也就是你在成為「Solution Architect」或是「DevOps Engineer」的主線任務中,額外想要特化 Data Analytics 的能力,就可以考慮考取 DAS。

等級︰專家級
長度:考試時間為 180 分鐘
成本:300 USD

DAS 適合什麼樣子的人來考 ?

  1. Data Scientist/Analyst 相關從業人員,且貴公司使用 AWS 作為雲端
    供應商
  2. 想要應徵 Data Scientist/Analyst 相關職位的同學
  3. 原本就熟悉 AWS 服務,想要了解數據分析 IT 架構的同學

我的話很明顯是屬於第三種人。由於工作中遇到數據中台的建構規劃,但對於數據的 infrastructure 相當不熟悉,就毅然決然報名 DAS,也 leverage 一下公司的資源 XD。在念的過程中除了越來越懂數據的架構,同時也能了解客戶關注的議題在哪裡,真的算的上是一劑靈丹妙藥 (喂~

DAS 證照考試內容:

DAS 有六大主題: Collection, Storage, Processing, Analysis, Visualization, Security,跟我們在談數據處理常常提到的「收、傳、算、用」其實是有相互呼應的。

DAS 考的內容著重於檢驗你是否能夠用AWS的服務去 Build up 一個「符合商業資料分析需求」的 Data Pipeline/infrastructure,你可以以想像你是一個資料科學家/架構師,在聽取用戶的需求後,如何去規劃架設你的 AWS 環境,並努力去為公司節省成本/達到最佳的效能。

而在對於資料回應需求越來越快的現代,著重的場景主要是在 Real-time 或是 Neal real-time 居多,也就對應到 AWS Kinesis 系列的資料串流服務。

DAS 證照準備

個人準備 DAS 的歷程約莫在 3–4 個月左右,12 月開始一路到 3 月考取,找上願意跟你一起奮鬥的朋友 (Big s/o to Roger),排好進度就準備領取你的證照啦~~~

Four Steps to GET Certified in AWS DAS

  1. Schedule !
    安排你的考試時間,你沒看錯,有刷卡才會念書。根據你的考試時間去分配你的課程進度以及練習題進度,是最有效率的做法。
  2. Take Classes
    使用 Udemy 課程 進行結構化的知識學習,講師 Stéphane Maarek 算是 Udemy 中 AWS 證照的幾大明星講師,值得信賴 (另外一位 Neal Davis 沒有出 DAS 的教學)。
  3. Take Notes
    分門別類進行筆記。個人是使用 Notion 做為筆記軟體,跟隨課程的進程記錄下自己的理解。
  4. Practice, Practice and Practice
    在 Examtopic/Udemy 上面找練習題來寫,並逐題檢討,紀錄下你每一個錯誤的判斷,並試圖找出正確的答案輔助你未來的答題 (秉持 8/2 法則,真的找不到就放過他,不是只有全對才會過)。

Three Tips for answering questions

  1. 關注對資料傳輸需求 (Real-time/ Neal real-time/Batch),可以快速刪減選項
  2. 關注 IT 管理的需求 (節省開支/最好效能/最小 effort),可以確認答題方向
  3. 不要選沒有 AWS 服務的答案;若答案中都有 AWS 服務,選 AWS 原生的服務較佳 (e.g. AWS Kinesis 優先序大於 AWS MSK)

結語

AWS Certified Data Analytics — Specialty (DAS) 的介紹就告此一段落了,希望大家都能夠憑藉這篇文章的引導,對目前 IT 產業的 Data Pipeline/infrastructure 有個概觀。

若有同學真的有意要考取這張證照,也預祝各位武運昌隆,都能順利考到 !

下回見~

--

--