Special Class Live! ในคอร์ส Road to Data Engineer 2.0!
What I have learned working with data — Jeno Yamma
สวัสดีครับ เนื่องจากในช่วงเดือนที่ผ่านมาผมได้มีโอกาสลงเรียนในคอร์ส
Road to Data Engineer กับทาง DataTH ก็เลยจะลองมาเขียนบทความสรุป
เกี่ยวกับ Special Class Live ที่น่าสนใจ (จริงๆอยากเขียนสรุปคอร์สมากกว่า😂)
ส่วนหัวข้อที่ผมได้เลือกมานั้นก็คือ
What I have learned working with data — Jeno Yamma
( ในคอร์สมี Special Class Live ที่น่าสนใจอีกหลายอย่างเลยครับ 😵)
เป็นการ Live สัมภาษณ์และตอบคำถามกับคุณ Jeno Yamma ซึ่งมีประสบการณ์ทางด้าน Data 4++ ปีที่ออสเตรเลีย🦘 ส่วนประวัติของคุณ Jeno นั้นก็มีประมาณว่า
คุณ Jeno ชอบทำอาหารและดื่มกาแฟ และชอบทำ Hackathons 😲
เวลาว่างคุณ Jeno ชอบเรียน AWS และ Snowflake และตอนนี้ได้เป็น AWS community builder และ Snowflake Superheroes😲
อ้อเกือบลืมไป คุณ Jeno แนะนำให้เข้าร่วมงาน Hackathons เพราะเราจะได้ความรู้จากงานนี้เยอะมาก
ต่อมาเป็นสิ่งที่คุณ Jeno ได้เล่าเกี่ยวกับการเรียนรู้ทางด้าน Data ให้ฟังทั้งก่อนและหลังการมาทำงานกับ Data มีหัวข้อหลักๆดังนี้เลย
Not all data are oils
ข้อมูลทุกอย่างไม่ได้สำคัญเท่ากัน และ การนำข้อมูลที่ทาง Bussiness ไม่ต้องการมาเก็บหรือนำมาใช้ก็อาจทำให้เสีย Resource กับ Storage และมีค่าใช้จ่ายเพิ่มมากขึ้นและต้องมีการพูดคุยกับทาง Bussiness เพื่อที่จะทำ Data Pipeline ของข้อมูลนั้นๆ เพื่อมา Monitor ให้เหมาะสม
Data can be messy, it’s ok!
ข้อมูลทุกอย่างอาจจะไม่ต้อง Cleanup Perfect 100% เพราะอาจมีการเปลี่ยนแปลงของข้อมูลนั้นอยู่ดี เช่น Data ที่มีชื่อเมือง การสะกดชื่อเมืองที่ต่างกันบางคนสะกดชื่อตัวย่อบางคนตัวเต็มและเราควรตั้งคำถามว่าข้อมูลนั้นเป็นประโยชน์กับเราหรือไม่ ซึ่งจะช่วยเราประหยัดเวลาไปได้มาก
Identify data maturity
ต้องดูระดับของข้อมูล Data ที่เรามีอยู่ว่าเราจะนำข้อมูลนั้นไปใช้ในระดับไหน เช่น
ระดับ 1 ต้องการเห็นภาพรวมของข้อมูล การทำ Dasboard เบื้องต้น
ระดับ 2 ต้องการนำข้อมูลไปใช้ เช่น การทำ Data Analyst ต้องมีการออกแบบ Schema และ ออกแบบ Data Pipeline เพื่อให้ Query ข้อมูลได้สะดวก
ระดับ 3 ต้องการประยุกต์ใช้ข้อมูล โดยเริ่มมีการนำ Machine Learning มาใช้เพื่อให้เกิดประโยชน์มากยิ่งขึ้น
Data as a capability
ข้อมูลนั้นไม่ได้นำมาใช้แค่ครั้งเดียว แต่ถูกใช้และเติบโตขึ้นเรื่อยๆ เวลาสร้างข้อมูลเราอาจจะต้องมี Data Warehouse เข้ามาช่วยหากข้อมูลจำนวนมหาศาล และ มีการใช้ Data Platform เช่น Airflow ช่วยในเรื่อง Alerting & Monitoring
DataBrick หรือ Snowflake ช่วยในการจัดการ Query ข้อมูล
Not everyone knows data
Data Engineer มีหน้าที่ต้องบอกว่า Data ที่มีอยู่นั้นคืออะไร ❔❓
และสามารถนำเอาข้อมูลไปใช้ได้อย่างไร เช่น มีการใช้ Data Dictionary ,Data Lineage, Data Catalogue เพื่อช่วยให้เรารู้หมวดหมู่และรายละเอียด
ของข้อมูลนั้นๆ
ยังมีเรื่อง DBT ( Data Build Tool) เป็นตัวช่วยในการจัดการ Data Catalogue กับ Data Governance และยังสามารถช่วยให้ Analyst ทำ Transformation ด้วยตัวเองเพื่อให้งานนั้นไว้ขึ้นอีกด้วย
ต่อมาเป็นช่วง Q&A ซึ่งมีหลายคำถาม ❓ เลยแต่ผมจะนำมาเล่าประมาณ
5 คำถามครับ
- ถ้าจะเริ่มทำงานในสายงาน Data ต้องมีปริญญาในด้าน Data ไหม ❔
ที่ออสเตรเลียไม่เคยมีใครถามถึงปริญญาเลย มีแต่ถามว่าเอาความรู้มาจากไหนและก็จะดู Certificate ต่างๆมากขึ้น ส่วนปริญญานั้นจะช่วยให้ทำ Visa ง่ายขึ้น
และปริญญาก็จะสอนเรื่องทั่วไป แตกต่างจากการเรียนคอร์สที่มีคนทำงานด้านนี้มาสอนโดยตรง - ถ้าจะเริ่มงานสาย Data ควรเริ่มจากตำแหน่งไหน DE (Data Engineer)❔
DA (Data Analyst) หรือ DS(Data Science)
คุณ Jeno แนะนำว่าควรเริ่มจาก DE เพราะ รู้จัก Data ได้ดีกว่า เป็นต้นทางเข้าของข้อมูล และ รู้ว่าข้อมูลไหนควรใช้กับ Production - อะไรควรศึกษาเป็นอย่างแรกสำหรับคนทำ Data❔
ต้องรู้ก่อนว่าเราอยากทำงานในสายไหน ถ้า
Data Science ก็ควรศึกษา Python,R
Data Engineer ก็ควรศึกษา SQL , Python - สกิลอะไรที่ทำให้เราโดดเด่นในงานสาย Data❔
Cloud Computing ช่วยให้เราโดดเด่น ทั้ง AWS , GCP , Azure เพราะถ้าเรารู้จักและประยุกต์ใช้ การสามารถช่วยในเรื่องการสมัครงาน บริษัทใหญ่หลายแห่งใช้ Cloud กันเป็นส่วนใหญ่ แม้แต่ Bank เองบางส่วนก็มีการใช้ Cloud - สถานการณ์ตลาดแรงงานสาย Data ที่ Australia เป็นอย่างไร❔
Hot มาก มีความต้องการงานสาย Data เยอะมาก เพราะ มีคนรู้งานทางด้านสายนี้น้อย 6 ปีที่แล้ว Hot ยังไงตอนนี้ก็ยังมีความต้องการมากอยู่ และ เดี๋ยวนี้ Australia จะ Remote มากขึ้น บางบริษัทก็ Remote 100% เลยไม่ต้องมี Office แล้ว
จบแล้วครับ 🙂
ต้องขอขอบคุณ ทางคอร์ส Road to Data Engineer ที่ได้เชิญคุณ Jeno มาร่วมแชร์ประสบการณ์การทำงานทางด้าน Data ให้ผมและผู้เรียนในกลุ่มได้รู้ถึงการทำงานในสาย Data มากขึ้นด้วยนะครับ
และนี่เป็นบทความแรกของผมถ้ามีอะไรผิดพลาดในส่วนไหน ขอภัยด้วยครับ
สามารถติชมหรืออยากให้ปรับปรุงส่วนไหน บอกผมได้เลยนะครับ🙇♂️
ส่วนตัวผมขอกลับไปเรียนต่อในคอร์ส Road to Data Engineer2.0
(ที่ผมได้ดองไว้ตอนนี้เรียนถึงCH6 แล้ว 🤣) ให้จบก่อนนะครับ 👋