Microsoft POWER BI The series EP.2

Tanakrit T
Tri Petch Digital
Published in
3 min readDec 23, 2022

จาก Series ที่แล้วเราพูดถึงเรื่อง Import Data เข้า Power BI ไปกันแล้ว หากใครยังไม่ได้ติดตามสามารถย้อนกลับไปอ่านบทความก่อนหน้าได้เลยน้าง่ายนิดเดียว

https://medium.com/tri-petch-digital/microsoft-power-bi-the-series-ep-1-5beebd15c731

วันนี้เราจะมาแนะนำวิธีการเตรียมข้อมูลให้พร้อม ก่อนที่จะเอาข้อมูลไปวิเคราะห์กัน ซึ่งทาง Power BI ได้เตรียม Feature ให้เราได้ใช้งานกันอย่างง่ายๆ ไว้แล้ว เช่น

  • การตรวจสอบข้อมูลเบื้องต้น
  • การเช็ค error ของข้อมูล
  • การแก้ไข data source
  • การรวมข้อมูลด้วย merge

โดยข้อมูลที่เรานำมาใช้ จะมาจาก Kaggle ซึ่งมีข้อมูลเยอะแยะและน่าสนใจมาก สามารถดาวน์โหลดมาลองเล่นได้ หรือลองฝึกตามกันได้เลย โดยข้อมูลที่เรานำมาใช้กันจะเป็นข้อมูลเกี่ยวกับ FIFA World Cup

Data exploration

  • Data exploration หรือการตรวจสอบข้อมูลเบื้องต้น หากข้อมูลไม่เป็นรูปแบบที่เราต้องการ เราก็สามารถปรับแต่งได้เบื้องต้น เพื่อให้ง่ายในการนำไปวิเคราะห์ต่อไป

เราจะเริ่มที่หน้า Transform data น้า เราจะมาส่องดูความเรียบร้อยของข้อมูลกันนน

หากเรา Import data เข้ามาแล้วเจอว่า!!😱 เห้ยชื่อ column มันตกลงไปเป็น row แรก อย่าเพิ่งตกใจน้า เราสามารถนำมาขึ้นมาเป็นชื่อ column ได้โดยเลือก Use First as Header แค่นั้นจะได้ชื่อ column ที่เราต้องการแล้ว

แต่เดี๋ยวน้า เห็นอะไรมั้ยเจอชื่อ column เป็น null เราสามารถ Rename Column ได้โดย คลิกขวาที่ Column เลือก Rename ซึ่งเราจะเปลี่ยนชื่อ column นั้นจาก null เป็น Index

ต่อมาไปดูเรื่อง Data type ของข้อมูลกันดีกว่าว่ามัน make sense มั้ยย🤔 ส่องๆดูแล้วโอเคอยู่นน้าา…. แต่ว่าถ้าหากจะจำเป็นต้อง เปลี่ยน Data type สามารถทำได้ ตัวอย่างคือจะเปลี่ยนจาก Text เป็น Number ก็สามารถคลิกมุมซ้ายตรง Column name แล้วเลือก Data type ที่เราต้องการได้เลย

ต่อไปมาส่องข้อมูลข้างใน Column กันเถอะ โดยการคลิกมุมขวาของ Column name Power BI จะแสดงกลุ่มข้อมูลทั้งหมดใน Column นั้นให้เราดูว่ามีข้อมูลอะไรบ้าง

หากว่าเราต้องการ Replace ข้อมูลข้างใน เช่นไม่ต้องการให้ข้อมูลเป็น Blank อยากจะให้เป็น None เราก็สามารถ 😉 คลิกที่ Replace value เท่านี้เราจะได้ข้อมูลที่ต้องการเพื่อจะไปวิเคราะห์กันแล้ววว…….

การเช็ค error ของข้อมูล

  • การเช็ค error ของข้อมูล ที่เรา import เข้ามาใช้ใน Power BI นั้นไม่ใช่เรื่องยาก เนื่องจาก ทาง Power BI จะคอยตรวจสอบ และ แสดงให้เราเห็นอัตโนมัติว่า ข้อมูลที่เรา import เข้ามาใช้นั้นมี error ตรงไหนบ้าง อย่างเช่นตัวอย่างด้านล่างนี้
จะเห็นว่า Power BI บอกว่า จาก 4 ไฟล์ ที่เรา import เข้ามาใช้ใน report จะมี 2 ไฟล์ที่ error และ มี error ไฟล์ละ 2 จุด
ทีนี้เราลองมาดู error ที่เกิดขึ้น โดยการ เลือก View errors
โดยเราสามารถ เลือก error ทางด้านซ้าย (1) และ มาเลือกดูจากในตารางว่าเกิด error เนื่องจากสาเหตุใด โดยการ click ลงไปในช่องนั้น (2) (** อย่าไปคลิกคำว่า Error)
Power BI จะบอกเราว่า คำว่า “Overall” ไม่สามารถ Convert เป็น type Number ใน column “Year” ได้

จากนั้นเราต้องมาหาวิธีแก้ไขให้ error หายไป

ถ้าเราไม่ต้องการให้ column “Year” เป็น type Number ให้เราเปลี่ยน Type เป็น Text

  • ให้เราเลือกไปที่ file ที่ error
  • เลือกที่ column “Year”
  • เลือก data type
  • เลือก Text
  • เลือก Replace current
จะเห็นว่า column “Year จะเป็นสีเขียวๆ ไม่มี error แล้ว

ถ้าเราอยากให้ column “Year” เป็นตัวเลขเหมือนเดิมเพื่อเอาไปใช้ใน report ให้กลับไปแก้ที่ไฟล์ csv ต้นทางไม่เห็นเป็นตัวหนังสือแล้วกลับมา refresh ข้อมูลอีกรอบ

  • กลับไปที่ Power BI เลือก Refresh Preview
  • เลือก Refresh All

จะเห็นว่า column “Year จะเป็นสีเขียวๆ ไม่มี error แล้ว และเราสามารถใช้ Type Number ใน report เราได้

สำหรับ Series หน้า เราจะมาแนะนำทุกคนให้รู้จักกับ Transform data #2 กันจะเกี่ยวกับการแก้ไข data source และการรวมข้อมูลโดยการ Merge

🙏ขอบคุณทุกคนที่เข้ามาติดตามผลงานของเรา หวังว่าจะเป็นประโยชน์ แล้วพบกันใหม่ใน Series หน้า 🖐

#PowerBI #TripetchIT #PowerBITheSeries #ExportData #DataScience #DataSci #DataAnalytic #Dashboard #Report #Excel #Visualization #Chart #Graph #DataAnalyst #Analyst #Analysis #Data #IT #Transformdata

บทความก่อนหน้า

https://medium.com/tri-petch-digital/microsoft-power-bi-the-series-ep-1-5beebd15c731

The author

  • Patcharanut Ittidetwatthana (Pond)
  • Suebsak Watcharothai (Pe)
  • Tanakrit Taeyanuluk (Hope)
  • Pimchanok Kaewbooddee (Oil)

--

--