Microsoft POWER BI The series EP2.2

Tanakrit T
Tri Petch Digital
Published in
3 min readDec 27, 2022

จาก Series ที่แล้วเราพูดถึงเรื่อง Transform Data #1 ไปแล้ว 2 ส่วนด้วยกัน

  • การตรวจสอบข้อมูลเบื้องต้น
  • การเช็ค Error ของข้อมูล

ใครยังไม่ได้ติดตาม สามารถย้อนกลับไปอ่านบทความก่อนหน้าได้น้า

https://medium.com/tri-petch-digital/microsoft-power-bi-the-series-ep-2-1d2049dc7c22

วันนี้เราจะมาต่อกันที่ Transform Data #2 จะมาต่อกันอีก 2 ส่วนคือ

  • การแก้ไข data source
  • การรวมข้อมูลด้วยการ merge

โดยข้อมูลที่เรานำมาใช้ จะมาจาก Kaggle เช่นเคย ซึ่งมีข้อมูลเยอะแยะ และน่าสนใจมาก สามารถดาวน์โหลดมาลองเล่นได้ หรือลองฝึกตามกันได้เลย โดยข้อมูลที่เรานำมาใช้กันจะเป็นข้อมูลเกี่ยวกับ FIFA World Cup

https://www.kaggle.com/datasets/rajkumarpandey02/fifa-world-cup-attendance-19302022

ถ้าพร้อมแล้วไปเริ่มกันเลย !!! 🏃‍♀️🏃‍♀️

การแก้ไข Data Source

บางครั้งเราอาจเจอปัญหา ไฟล์ข้อมูลอันใหม่ไม่ได้วางอยู่ใน path/folder เดิมหรือว่าไฟล์ข้อมูลใหม่มีการเปลี่ยนชื่อไปแล้ว (😭 นี้เราต้องทำ Visualize ใหม่หรอเนี่ยย!) ในที่นี้ Power BI เราสามารถเปลี่ยน data source โดยที่ไม่กระทบถึง Visualize ที่เราได้สร้างไว้ก่อนหน้า โดยที่เราจะแบ่งการแก้ไข data source ออกเป็น 2 กรณีคือ

กรณีที่ Data Structure เหมือนเดิม แต่เปลี่ยนแค่ path/folder ในการเก็บไฟล์

  • เราสามารถเปลี่ยน path/folder ของไฟล์ใหม่ได้โดยการคลิก
    Transform data → Data source settings
  • เลือกไฟล์ที่ต้องการจะเปลี่ยน path/folder → คลิก Change source… → คลิก Browse เพื่อเลือกไฟล์ข้อมูลอันใหม่ → คลิก OK
    หลังจากที่ทำตามขั้นตอนสำเร็จ ข้อมูลใน Power BI ก็จะทำการอัพเดทให้อัตโนมัติ

กรณีที่ Data Structure เหมือนเดิม แต่มีการเพิ่ม column

ถ้าเราเพิ่ม column ในไฟล์ข้อมูลตั้งต้น แต่พอมา Refresh ใน Power BI กลับพบว่า column ที่เพิ่มมาใหม่ไม่ปรากฎขั้นมา ในกรณีนี้เราจะต้องเข้าไปแก้ไข Parameter ในหน้า Power Query Editor โดยมีขั้นตอนดังนี้

  • ที่แถบเมนู Home → คลิกที่ Transform data
  • หลังจากเข้ามาที่หน้า Power Query Editor แล้วให้เลือก “Source” ที่ Applied Steps (ด้านขวาของหน้าจอ) → ที่ Formula Bar จะแสดง parameter ที่จะต้องแก้ไขก็คือ “Columns” ให้ผู้อ่านแก้ไขจำนวน column ให้เท่ากับไฟล์ตั้งต้นได้เลย → หลังจากแก้ไขเสร็จอย่าลืมกด Close & Apply ด้วยน้า

ทริคเล็กๆ: ถ้าเรา Import .csv ลืมเปลี่ยน File Original / Encoding ตอนที่ Import Data เข้ามาก็สามารถมาแก้ไขได้ในหน้าเดียวกัน โดยสามารถแก้ไขได้ที่ parameter ที่ชื่อว่า “Encoding” (สำหรับภาษาไทย UTF-8 ก็สามารถใส่ “65001” ได้เลยน้า)

การ Merge Queries

สมมติว่าเรามีข้อมูลอยู่ 2 ชุด และเราต้องการ join ข้อมูล 2 ชุด ให้กลายเป็นข้อมูลชุดใหม่ สามารถทำได้โดยมีขั้นตอนดังนี้

  • คลิกไปที่ Merge Queries → Merge Queries as New
  • คลิกเลือก table ที่เราต้องการเอามา join หลังจากนั้น ให้คลิกเลือก column ที่เราจะใช้ในการ join สุดท้ายให้เลือกวิธีในการ join

ในตัวอย่าง เราใช้ข้อมูล FIFA World Cup Attendance กับ List of FIFA World Cup final มา join กันโดยใช้ year เป็น key ส่วนวิธีการ join เราใช้เป็น Left Outer

สำหรับวิธีการ join เพื่อน ๆ สามารถศึกษาเพิ่มเติมจากลิ้งนี้ได้เลย

https://www.powerbi-pro.com/en/power-bi-seven-types-of-table-joins/

  • หลังจากที่เรา set up ทั้งหมดแล้ว ให้คลิก OK จากนั้น power BI จะสร้าง table ใหม่ตามรูป
  • ขั้นตอนสุดท้ายให้เรามากดเลือก column ที่เราต้องการจะใช้ตามรูป จากนั้นคลิก OK เราก็จะได้ table ใหม่ที่เราเอาไปใช้ทำงานต่อได้เลย

สำหรับ Series หน้า เราจะมาแนะนำทุกคนให้รู้จักกับ การสาสร้าง new column และ measure ใหม่ขึ้นมา เพื่อจะได้นำข้อมูลไปวิเคราะห์ของเราต่อไป

🙏ขอบคุณทุกคนที่เข้ามาติดตามผลงานของเรา หวังว่าจะเป็นประโยชน์ แล้วพบกันใหม่ใน Series หน้า 🖐

#PowerBI #TripetchIT #PowerBITheSeries #ExportData #DataScience #DataSci #DataAnalytic #Dashboard #Report #Excel #Visualization #Chart #Graph #DataAnalyst #Analyst #Analysis #Data #IT #Transformdata

บทความก่อนหน้า

https://medium.com/tri-petch-digital/microsoft-power-bi-the-series-ep-1-5beebd15c731

https://medium.com/tri-petch-digital/microsoft-power-bi-the-series-ep-2-1d2049dc7c22

The author

  • Patcharanut Ittidetwatthana (Pond)
  • Suebsak Watcharothai (Pe)
  • Tanakrit Taeyanuluk (Hope)
  • Pimchanok Kaewbooddee (Oil)

--

--