The path to becoming a Data science (Series) Chapter 01

FruK'en Bbd
FrukkurT
3 min readAug 11, 2019

--

หนทางสู่การเป็น Data science ฉบับ series ตอนที่ 1

Happiness is an attitude. We either makes ourselves miserable or happy and strong. It is your choice.”

“ความสุขเป็นเพียงทัศนคติหนึ่ง เราจะทำชีวิตให้เศร้า สุข หรือเข้มแข็ง

ขึ้นอยู่กับเราเลือกที่จะเป็น” (kushandwisdom.tumblr)

สวัสดีพ่อแม่พี่น้อง และ มิตรสหายทั้งหลาย

ใน series นี้ จะเป็นการเล่าถึง ที่มา ความสนใจ จนกระทั่งไปถึงการเรียนรู้ในการเป็น Data science ของผมนะครับ ซึ่งการบอกเล่าเรื่องราวต่างๆแทนการเป็นบทความ และจะมีการสอดแทรกความรู้ในสายงานนี้เข้าไป อาจจะมี เรื่องของคำพูดส่วนตัวเข้ามาเกี่ยวข้องด้วยนะครับ

ประมาณ เมื่อกลางปีที่แล้ว เราอาจจะเจอคำว่า “Big data” หรือ “Data science”

designed by freepik

ซึ่งส่วนตัวผมเองนั้น จบวิศวะโยธามา ซึ่งในอาชีพก็ไม่ได้ใช้เทคโนโลยีอะไรมาก (โดยส่วนตัวเป็นคนชอบ เทคโนโลยีเป็นพื้นฐานอยู่แล้ว) แต่พอเราได้ยินหรือได้เห็นจาก เพจ ต่างๆ หรือ ในโทรทัศน์ ก็จะเจอ Big data เรื่อยๆ จน

“โอเค ลองหาข้อมูลดู”

ซึ่งคนส่วนใหญ่ คงจะเลือก search engine อากู๋แต่ผมนั้นไซร้ หาใน FB แทน

Why? เพราะ ถ้าผมเจอกลุ่มหรือเพจผมก็สามารถดู จำนวนผู้ติดตาม หรือ กลุ่มคนที่สนใจเรื่องๆนี้ได้มากน้อยแค่ไหนซึ่งพอค้นหาดู
ก็เจอ Artificial Intelligence, Internet of Things, Big Data, Robotics กรรม มีอะไรตามมาอีกเป็นกระบวนเลย แต่ก็ ลองหาเพจดูก็เจอเพจ Data Th .com และ ก็เจอคลิปของ คุณ Suthichai Yoon นะคร่าบบบ กับ ดร.อสมา กุลวานิชไชยนันท์(เจ้าของเพจ Data Driven Business by Coraline และ ผู้เขียนหนังสือ Big Data Series )

จาก FB คุณ Suthichai Yoon
จาก FB เพจ Data Driven Business By Coraline

ลองไปหาดูชมก็ได้นะครับ

“ส่วนตัวยังอ่านไม่จบนะครับ”

โดยหลักๆ การชม คลิปการสนทนา ระหว่าง คุณ สุทธิชัย กับ ดร.แป้ง

ก็จะ พูดถึงเรื่อง Big data ความเข้าใจ และการใช้ประโยชน์ จากมัน

ซึ่งเมื่อผมลองหาข้อมูลเพิ่มเติมจาก หลายๆ แหล่งนั้น ทำให้พบว่า

fliptoptv

“ใครๆก็พูดว่า Big Data จน มันกลาย เป็น Buzz word ซะแล้ว”

Buzz word คืออะไร Buzz word คือเสียงของผึ้งดังหึ่งๆ …. ไม่ใช่นะครับแต่เป็นคำพูดหรือคำที่อยู๋ดีๆก็เป็นที่นิยมขึ้นมา ซึ่ง คำว่า”Big data ”ก็ฮิตติดปากขึ้นมา จริงๆแล้ว Big data มันก็คือ data เฉยๆ นี่แหละครับ แต่ มันมากและมีขนาดใหญ่จนไม่สามารถ ใช้ ซอฟต์แวร์หรือฮาร์ดแวร์ธรรมดาจัดการได้(excel เปิดไม่ได้เยอะเกิน) ซึ่งจะต้องใช้ storage จำนวนมากและข้อมูลพวกนั้นต้องมีประสิทธิภาพใช้งานได้จริง แต่มีการจำแนกว่าอันไหน big ไม่ big ดูได้อย่าไร

ซึ่งหลักๆ “Big data”จะประกอบด้วย 4 V

https://www.d1asia.co.th

“ซึ่ง 4 Vไม่ใช่จำนวนลูกสูบ แต่คือข้อมุูล ”

  1. Volume(ขนาด) คือ ถ้าขนาดเล็กๆ excel เปิดได้คงไม่ใช่ จริงๆ แล้วไม่อยากให้เอา แค่ excel เป็น บรรทัดฐานแต่ให้มองถึงเรื่องของ ขนาดของข้อมูลที่มีมากขึ้นรับมากขึ้นเรื่อยๆ และ scale ที่มากขึ้น
  2. Velocity(รวดเร็ว) คือ ข้อมูลมีการเปลี่ยนแปลงตลอดเวลา ซึ่งจะต้องจัดเก็บและเรียกใช้ได้รวดเร็ว
  3. Variety(ความหลากหลาย)คือ ข้อมูล มีทั้ง รูป เสียง ข้อความ และ อื่นๆอีกมากมาย
  4. Veracity(การปะปนของข้อมูล) คือ เมื่อ ข้อมูลมาจากหลายๆแหล่งทำให้มันไม่ใช่รูปแบบเดียวกัน มีทั้งข้อมูลที่ดี และไม่ดี ใช้ได้และก็ใช้ไม่ได้ ซึ่งเราต้อง cleansing data ก่อนใช้เสมอ

แต่ในปัจจุบันมี 5 ถึง 6 V แล้ว (อาจจะถึง10 แล้วมั้ง) ซึ่งสิ่งที่เพิ่มขึ้นมา ขอยกตัวอย่าง เช่น

5.Value (มูลค่า) ซึ่งข้อมูลจะมีมูลค่านั้นก็ขึ้นอยู่กับว่า กลุ่มไหน ธุรกิจไหน หรือ ใคร ต้องการข้อมูล หรือให้ความสำคัญของข้อมูลมากกว่ากัน เพราะว่า ข้อมูลเดียวกัน เมื่ออยู่ต่างกลุ่มกันก็อาจจะมีค่าไม่เท่ากัน

6.Vulnerability (ความอ่อนแอ) เมื่อข้อมูลที่มาจากเราหรือจากการเก็บข้อมูลนั้นมีมากขึ้น มันอาจจะเกิดปัญหาว่า ตัวตนหรือข้อมูลที่สำคัญที่ไม่อยากให้ผู้อื่นรู้ มันอาจจะหลุดออกไปได้ ซึ่งข้อมูลนั้นก็ควรจะมี ความปลอดภัยด้วยเช่นกัน เช่น FB แท็กรูป ของเราอัตโนมัติ ทำให้ ความลับรั่วไหล (โดยเฉพาะท่านชายทั้งหลาย)

“แล้วมันเกี่ยวอะไรกับ Data science”

ก็เพราะข้อมูลมันมีจำนวนมาก อีกทั้ง มันมีความเร็วในการจัดเก็บ ข้อมูลที่สมบูรณ์ และไม่สมบูรณ์ ข้อมูลขยะก็เยอะ ซึ่ง มันก็ cleansing สิ แล้ว ใคร จะมาทำหละ

“ก็ Data science ไง”

แต่จริงๆ แล้ว หน้าที่ของ Data science นั้นไม่ได้มีแค่นั้น ซึ่งในข้อมูลเหล่านั้น ต้องการ การวิเคราะห์ที่มีประสิทธิภาพ การดึงเอาความรู้ และ การค้นหาข้อมูลเชิงลึกซึ่งซ่อนอยู่ในนั้น(insight) โดยใช้ กระบวณการทางสถิติ และ เทคโนโลยีเข้ามาเกี่ยวข้อง

ซึ่งในการค้นหาแต่ละครั้งของผมนั้น ก็จะเจอ ความต้องการในตลาดแรงงาน ไม่ว่าในประเทศไทย หรือ ต่างประเทศ ก็ จะมีคำว่า

“อาชีพที่ sexy ที่สุดในตอนนี้ ”

ตอนนี้ผมคิดในใจเลยว่า

“ sexy อะไรฟระ ถ่ายแบบงี้เหรอ”

https://jwzhangnyc.files.wordpress.com

sexy ในที่นี้คงจะเป็น อาชีพที่มีความต้องการมากในตอนนี้ และหาตัวจับได้ยาก ซึ่ง พอลองหาดูในเว็บ สมัครงานต่างๆ จะเห็นเลยว่ามีความต้องการและ ค่าตอบแทนที่สูง ซึ่งที่ชัดเจนที่สุดในเว็บสมัครงาน จะมี พวกธนาคารต่างๆ ในประเทศที่ต้องการมากๆ จริงๆแล้วไม่ได้มีธนาคารอย่างเดียว มีทั้ง ภาคอุตสาหกรรม เครือข่ายมือถือ ธุรกิจ e-commerce แม้กระทั่ง องค์กรเอกชน หรือ รัฐบาล ก็ต้องการทั้งนั้น ทำให้ อาชีพนี้ มีรายได้ที่สูงพอสมควร ซึ่งเปรียบเทียบกับอาชีพ ปัจจุบัน ของผมนั้น แทบจะเทียบกันไม่ได้เลย (ส่วนตัวผมจบ วิศวะ โยธามา) ซึ่งอย่าเอามาเทียบกันเลย…เศร้า ครับ

ซึ่งการจะเป็น Data science นั้น ต้องมี คุณสมบัติหรือทักษะ อะไรบ้าง

ติดตามต่อในตอนถัดไปนะครับ

…ถ้าชอบ รบกวน ปรบมือ เป็นกำลังใจด้วยนะครับ…

--

--