Siriwut Kongkrajong
3 min readOct 17, 2021

Special Class Live! ในคอร์ส Road to Data Engineer 2.0!
What I have learned working with data — Jeno Yamma

สวัสดีครับ เนื่องจากในช่วงเดือนที่ผ่านมาผมได้มีโอกาสลงเรียนในคอร์ส
Road to Data Engineer กับทาง DataTH ก็เลยจะลองมาเขียนบทความสรุป
เกี่ยวกับ Special Class Live ที่น่าสนใจ (จริงๆอยากเขียนสรุปคอร์สมากกว่า😂)

ส่วนหัวข้อที่ผมได้เลือกมานั้นก็คือ

What I have learned working with data — Jeno Yamma
( ในคอร์สมี Special Class Live ที่น่าสนใจอีกหลายอย่างเลยครับ 😵)

Photo by ian dooley on Unsplash

เป็นการ Live สัมภาษณ์และตอบคำถามกับคุณ Jeno Yamma ซึ่งมีประสบการณ์ทางด้าน Data 4++ ปีที่ออสเตรเลีย🦘 ส่วนประวัติของคุณ Jeno นั้นก็มีประมาณว่า

คุณ Jeno ชอบทำอาหารและดื่มกาแฟ และชอบทำ Hackathons 😲
เวลาว่างคุณ Jeno ชอบเรียน AWS และ Snowflake และตอนนี้ได้เป็น AWS community builder และ Snowflake Superheroes😲

อ้อเกือบลืมไป คุณ Jeno แนะนำให้เข้าร่วมงาน Hackathons เพราะเราจะได้ความรู้จากงานนี้เยอะมาก

Photo by Alex Kotliarskyi on Unsplash
Photo by Franki Chamaki on Unsplash

ต่อมาเป็นสิ่งที่คุณ Jeno ได้เล่าเกี่ยวกับการเรียนรู้ทางด้าน Data ให้ฟังทั้งก่อนและหลังการมาทำงานกับ Data มีหัวข้อหลักๆดังนี้เลย

Not all data are oils
ข้อมูลทุกอย่างไม่ได้สำคัญเท่ากัน และ การนำข้อมูลที่ทาง Bussiness ไม่ต้องการมาเก็บหรือนำมาใช้ก็อาจทำให้เสีย Resource กับ Storage และมีค่าใช้จ่ายเพิ่มมากขึ้นและต้องมีการพูดคุยกับทาง Bussiness เพื่อที่จะทำ Data Pipeline ของข้อมูลนั้นๆ เพื่อมา Monitor ให้เหมาะสม

Photo by Zbynek Burival on Unsplash

Data can be messy, it’s ok!
ข้อมูลทุกอย่างอาจจะไม่ต้อง Cleanup Perfect 100% เพราะอาจมีการเปลี่ยนแปลงของข้อมูลนั้นอยู่ดี เช่น Data ที่มีชื่อเมือง การสะกดชื่อเมืองที่ต่างกันบางคนสะกดชื่อตัวย่อบางคนตัวเต็มและเราควรตั้งคำถามว่าข้อมูลนั้นเป็นประโยชน์กับเราหรือไม่ ซึ่งจะช่วยเราประหยัดเวลาไปได้มาก

Photo by KS KYUNG on Unsplash

Identify data maturity
ต้องดูระดับของข้อมูล Data ที่เรามีอยู่ว่าเราจะนำข้อมูลนั้นไปใช้ในระดับไหน เช่น
ระดับ 1 ต้องการเห็นภาพรวมของข้อมูล การทำ Dasboard เบื้องต้น
ระดับ 2 ต้องการนำข้อมูลไปใช้ เช่น การทำ Data Analyst ต้องมีการออกแบบ Schema และ ออกแบบ Data Pipeline เพื่อให้ Query ข้อมูลได้สะดวก
ระดับ 3 ต้องการประยุกต์ใช้ข้อมูล โดยเริ่มมีการนำ Machine Learning มาใช้เพื่อให้เกิดประโยชน์มากยิ่งขึ้น

Photo by Headway on Unsplash

Data as a capability
ข้อมูลนั้นไม่ได้นำมาใช้แค่ครั้งเดียว แต่ถูกใช้และเติบโตขึ้นเรื่อยๆ เวลาสร้างข้อมูลเราอาจจะต้องมี Data Warehouse เข้ามาช่วยหากข้อมูลจำนวนมหาศาล และ มีการใช้ Data Platform เช่น Airflow ช่วยในเรื่อง Alerting & Monitoring
DataBrick หรือ Snowflake ช่วยในการจัดการ Query ข้อมูล

Photo by Łukasz Rawa on Unsplash

Not everyone knows data
Data Engineer มีหน้าที่ต้องบอกว่า Data ที่มีอยู่นั้นคืออะไร ❔❓
และสามารถนำเอาข้อมูลไปใช้ได้อย่างไร เช่น มีการใช้ Data Dictionary ,Data Lineage, Data Catalogue เพื่อช่วยให้เรารู้หมวดหมู่และรายละเอียด
ของข้อมูลนั้นๆ

Photo by Edwin Andrade on Unsplash

ยังมีเรื่อง DBT ( Data Build Tool) เป็นตัวช่วยในการจัดการ Data Catalogue กับ Data Governance และยังสามารถช่วยให้ Analyst ทำ Transformation ด้วยตัวเองเพื่อให้งานนั้นไว้ขึ้นอีกด้วย

Photo by Jon Tyson on Unsplash

ต่อมาเป็นช่วง Q&A ซึ่งมีหลายคำถาม ❓ เลยแต่ผมจะนำมาเล่าประมาณ
5 คำถามครับ

  1. ถ้าจะเริ่มทำงานในสายงาน Data ต้องมีปริญญาในด้าน Data ไหม ❔
    ที่ออสเตรเลียไม่เคยมีใครถามถึงปริญญาเลย มีแต่ถามว่าเอาความรู้มาจากไหนและก็จะดู Certificate ต่างๆมากขึ้น ส่วนปริญญานั้นจะช่วยให้ทำ Visa ง่ายขึ้น
    และปริญญาก็จะสอนเรื่องทั่วไป แตกต่างจากการเรียนคอร์สที่มีคนทำงานด้านนี้มาสอนโดยตรง
  2. ถ้าจะเริ่มงานสาย Data ควรเริ่มจากตำแหน่งไหน DE (Data Engineer)❔
    DA (Data Analyst) หรือ DS(Data Science)
    คุณ Jeno แนะนำว่าควรเริ่มจาก DE เพราะ รู้จัก Data ได้ดีกว่า เป็นต้นทางเข้าของข้อมูล และ รู้ว่าข้อมูลไหนควรใช้กับ Production
  3. อะไรควรศึกษาเป็นอย่างแรกสำหรับคนทำ Data❔
    ต้องรู้ก่อนว่าเราอยากทำงานในสายไหน ถ้า
    Data Science ก็ควรศึกษา Python,R
    Data Engineer ก็ควรศึกษา SQL , Python
  4. สกิลอะไรที่ทำให้เราโดดเด่นในงานสาย Data❔
    Cloud Computing ช่วยให้เราโดดเด่น ทั้ง AWS , GCP , Azure เพราะถ้าเรารู้จักและประยุกต์ใช้ การสามารถช่วยในเรื่องการสมัครงาน บริษัทใหญ่หลายแห่งใช้ Cloud กันเป็นส่วนใหญ่ แม้แต่ Bank เองบางส่วนก็มีการใช้ Cloud
  5. สถานการณ์ตลาดแรงงานสาย Data ที่ Australia เป็นอย่างไร❔
    Hot มาก มีความต้องการงานสาย Data เยอะมาก เพราะ มีคนรู้งานทางด้านสายนี้น้อย 6 ปีที่แล้ว Hot ยังไงตอนนี้ก็ยังมีความต้องการมากอยู่ และ เดี๋ยวนี้ Australia จะ Remote มากขึ้น บางบริษัทก็ Remote 100% เลยไม่ต้องมี Office แล้ว

จบแล้วครับ 🙂

Photo by Sigmund on Unsplash

ต้องขอขอบคุณ ทางคอร์ส Road to Data Engineer ที่ได้เชิญคุณ Jeno มาร่วมแชร์ประสบการณ์การทำงานทางด้าน Data ให้ผมและผู้เรียนในกลุ่มได้รู้ถึงการทำงานในสาย Data มากขึ้นด้วยนะครับ

และนี่เป็นบทความแรกของผมถ้ามีอะไรผิดพลาดในส่วนไหน ขอภัยด้วยครับ
สามารถติชมหรืออยากให้ปรับปรุงส่วนไหน บอกผมได้เลยนะครับ🙇‍♂️

ส่วนตัวผมขอกลับไปเรียนต่อในคอร์ส Road to Data Engineer2.0
(ที่ผมได้ดองไว้ตอนนี้เรียนถึงCH6 แล้ว 🤣) ให้จบก่อนนะครับ 👋