Microsoft POWER BI The series EP.1
หลังจากที่เราต้องทนกับการที่ MS Excel ค้างแล้วค้างอีก รอแล้วรออีก งานไม่ทันส่ง ปัญหามากมายกายกองกับ การทำงานที่ต้องมีการใช้ข้อมูลจำนวนมากๆ
ทุกคนเคยประสบปัญหา วิเคราะห์ข้อมูลใน MS Excel จำนวนมากๆ จำนวนเยอะๆ จำนวนหลักแสน หรือ มีข้อมูลหลักล้าน บ้างไหม
พวกเราทีม Data จากบริษัท Tripetch-IT มี Tool ที่น่าสนใจมานำเสนอ นั่นคือ MS Power BI
เรามารู้จักข้อดีของ น้อง MS Power BI กันคร่าวๆ ดีกว่าครับ
- ฟรี และสามารถใช้งาน Offline ได้
- รองรับแหล่งข้อมูลหลากหลายรูปแบบ
- สามารถ Transform ข้อมูลได้ตามที่ต้องการสามารถ
- มีสูตรพื้นฐานคล้าย MS Excel
- สามารถ Custom graph ได้หลากหลายรูปแบบ
- สามารถกำหนดสิทธิ์การเข้าถึงข้อมูลได้
ก่อนอื่นเราต้องทำการ Install Power BI Desktop ทำได้ 2 ช่องทาง
- Download จาก link นี้ได้เลย
https://www.microsoft.com/en-us/download/details.aspx?id=58494
- ติดตั้งผ่าน Microsoft Store (ต้องมี Account Microsoft)
https://aka.ms/pbidesktopstore
งั้นเรามาลองเริ่มใช้งาน MS Power BI กันเลย โดยเริ่มจากการ Import data โดยทาง MS Power BI มี Connector ให้เราสามารถ Connect กับข้อมูลได้หลากหลายช่องทางมากๆ
Excel
- เลือก Connector เป็น Excel
- จากนั้นเลือกไฟล์จากเครื่องแล้วกดปุ่ม Open
- MS Power BI จะ Preview ข้อมูลให้ดูเบื้องต้น จะเห็นว่าหากไฟล์ Excel มีมากกว่า 1 ไฟล์ เราก็สามารถเลือกไฟล์ที่ต้องการได้ หากเลือกไฟล์ที่ต้องการแล้วสามารถกดปุ่ม Load ได้เลย แต่ว่าหากต้องการแปลงชนิดข้อมูลเพิ่มเติม คลิกที่ transform data ซึ่งเราจะมาอธิบายเพิ่มเติมใน series ถัดๆไป
- หากคลิกปุ่ม Load แล้วข้อมูลจะแสดงหน้าต่างขวามือของคุณ
TEXT file / CSV file
- เลือก Connector เป็น Text/CSV
- จากนั้นเลือกไฟล์จากเครื่องแล้วกดปุ่ม Open
- MS Power BI จะ Preview ข้อมูลให้ดูเบื้องต้น โดย
จะเห็นได้ว่าเราสามารถเลือกชนิดของไฟล์ File Origin ชนิดตัวคั่น หรือตรวจสอบชนิดของข้อมูลในไฟล์ข้อมูลเบื้องต้น หากเรียบร้อยแล้วสามารถคลิก Load ได้เลย แต่ว่าหากต้องการแปลงชนิดข้อมูลเพิ่มเติม คลิกที่ transform data ซึ่งเราจะมาอธิบายเพิ่มเติมใน series ถัดๆไป
เพิ่มเติม : เรามักเจอปัญหา Import file ภาษาไทย มาแล้วเจอปัญหาภาษาต่างดาว เราสามารถเลือก File Origin Unicode UTF-8 เพื่อแก้ปัญหาได้น้า
- หากคลิกปุ่ม Load แล้วข้อมูลจะแสดงหน้าต่างขวามือของคุณ
Folder
ถ้าเรามีไฟล์ที่ต้องการจะอัพเดทข้อมูลทุกๆวัน ทุกๆสัปดาห์ หรือทุกๆเดือน ใน format เดียวกัน
- เลือก Connector เป็น Folder
- จากนั้นเลือก folder ที่เก็บไฟล์ที่เราต้องการใช้
- Power BI จะ List ไฟล์ใน folder นั้นทั้งหมดมาให้เรา
- จากนั้นเลือก Combine & Load เพื่อทำการรวมไฟล์ทั้งหมดใน folder เข้าด้วยกัน
- ในหน้า Combine Files ถ้า Format ของไฟล์เราเหมือนกันทั้งหมด ให้เลือก First file แล้วกด OK ได้เลย
- เพียงเท่านี้เราก็จะได้ข้อมูลมาใช้ในการออก report ง่ายๆ
- ถ้ามีไฟล์เข้ามาใหม่ เราก็แค่ ใส่ไฟล์ลงใน Folder ที่เราตั้งไว้
- แล้วไปกด Refresh ในหน้า Power BI ของเรา
- เราก็จะได้ข้อมูลใหม่เข้ามาใช้ใน report ของเราอย่างรวดเร็ว
Website
ในรูป ถ้าหากเราเห็น html table ในเว็บ แล้วเราต้องการดึงข้อมูลส่วนนั้นมาใช้ในการวิเคราะห์ สามารถทำได้ โดยมีขั้นตอนดังนี้
- เลือก connector เป็น web
- ใส่ URL ที่เราต้องการจะดึงข้อมูล
- หลังจากนั้น Power BI จะแสดงตัวอย่างข้อมูล ถ้าเป็นข้อมูลที่เราต้องการแล้วให้กดเลือก table นั้น แล้วกด Load ได้เลย
ความจริงการดึงข้อมูลจากเว็บยังมีลูกเล่นให้ใช้อีกเยอะ แต่ไว้ค่อยว่ากันอีกทีในตอนถัดไป
การนำข้อมูลที่เป็นตารางในไฟล์ PDF มาวิเคราะห์จะไม่ยากอีกต่อไป (ถ้าตารางในไฟล์ PDF ไม่ใช่รูปภาพ) MS Power BI มี Connector ที่สามารถอ่านข้อมูลตารางในไฟล์ PDF เพียงทำตามขั้นตอนนี้ก็สามารถดึงข้อมูลในไฟล์ PDF มาวิเคราะห์ได้สบายๆ
- เลือกประเภทไฟล์ PDF แล้วเลือกไฟล์ PDF ที่ต้องการจะ Import
ในหน้า Navigator จะแบ่งข้อมูลที่นำเข้ามาเป็น 2 ส่วน โดย Power Query สามารถแยกได้ว่าส่วนไหนเป็นตาราง
- ส่วนที่ 1 (กรอบสีเขียว) ที่ขึ้นต้นด้วยคำว่า ‘Table’ จะเป็นข้อมูลที่เป็นตารางจากไฟล์ PDF
- ส่วนที่ 2 (กรอบสีฟ้า) จะเป็นหน้าที่เหมือนในไฟล์ PDF
ซึ่งส่วนใหญ่เราจะดึงข้อมูลที่เป็น Table ไปใช้
- ตอนนี้ข้อมูลที่เราเลือกมาจะแยกตารางอยู่ ให้ทำการรวมข้อมูลในตารางก่อนที่จะนำข้อมูลไปใช้ โดยคลิกที่ Transform Data เราจะพบว่าชื่อคอลัมม์ของทั้ง 2 ตารางไม่เหมือนกัน ต้องทำการเปลี่ยนชื่อตารางทั้ง 2 เหมือนกันก่อนถึงจะรวมตารางได้
หลังจากที่เปลี่ยนชื่อคอลัมม์ทั้ง 2 ตารางให้เหมือนกันแล้ว ให้เลือก Append Queries
- ในกรณีที่อยากเพิ่มข้อมูลไปในตารางที่มีอยู่ ให้เลือก Append Queries
- ในกรณีที่อยากให้ข้อมูลที่รวมขึ้นเป็นตารางใหม่ ให้เลือก Append Queries as New
ในตัวอย่างจะเอาข้อมูลจาก Table002 ไปต่อกับ Table001 ก็สามารถเลือก Two tables
หรือถ้ามีตารางที่จะเอาข้อมูลไปต่อมากกว่า 2 ตาราง ก็สามารถเลือก Three or more tables
แค่นี้เราก็สามารถดึงข้อมูลในไฟล์ PDF มาวิเคราะห์ได้สบายๆ
ทริคเล็กๆ
ในตอนที่ Transform Data เราสามารถระบุ หน้าเริ่มต้น และ หน้าสิ้นสุด เป็นพารามิเตอร์ตัวเลือกสําหรับการเชื่อมต่อ PDF โดยสามารถระบุพารามิเตอร์ตรงแถบพิมพ์สูตรตามขั้นตอนดังนี้
- เลือก Source ที่ APPLIED STEPS
- เพิ่มพารามิเตอร์ StartPage และ EndPage เข้าไปในสูตร Pdf.Tables(File.Contents(“c:\sample.pdf”), [StartPage=10, EndPage=11])
สำหรับ Series หน้า เราจะมาแนะนำทุกคนให้รู้จักการทำ Data Management โดยการ Transform Data ของ Power BI กันนะครับ
🙏ขอบคุณทุกคนที่เข้ามาติดตามผลงานของเรา หวังว่าจะเป็นประโยชน์ แล้วพบกันใหม่ใน Series หน้า 🖐
#PowerBI #TripetchIT #PowerBITheSeries #ExportData #DataScience #DataSci #DataAnalytic #Dashboard #Report #Excel #Visualization #Chart #Graph #DataAnalyst #Analyst #Analysis #Data #IT
The author
- Patcharanut Ittidetwatthana (Pond)
- Suebsak Watcharothai (Pe)
- Tanakrit Taeyanuluk (Hope)
- Pimchanok Kaewbooddee (Oil)
Credit:
https://www.pexels.com/photo/marketing-iphone-smartphone-notebook-34069/
https://www.kaggle.com/datasets/makindekayode/nigerian-car-prices-dataset?resource=download