Anomaly & Fraud Detection กับ คุณเจ วรวุฒิคุณชัย data science ด้าน Fraud investigation

Tonmint
botnoi-classroom
Published in
5 min readJul 12, 2021

คอร์สเรียนบอทน้อย Data Science Essential#3
EP. 8 Anomaly & Fraud Detection

สวัสดีค่ะทุกคนกลับมาพบกับคอร์สเรียนของบทน้อย Episode ที่ 8 กันแล้วนะคะ วันนี้มีโอกาสได้ฟัง ดร.วินน์ วรวุฒิคุณชัย สัมภาษณ์คุณเจ วรวุฒิคุณชัย ในหัวข้อเรื่อง Anomaly & Fraud Detection คุณเจจะมาเล่าประสบการณ์การทำงานสาย data science ด้าน Fraud investigation

แต่ก่อนจะเริ่มฟังบทสัมภาษณ์ของคุณเจ เราไปทำความรู้จักคำว่า Anomaly & Fraud Detection กันก่อนนะคะ

What is Anomaly Detection?

คือการใช้วิธีทางคณิตศาสตร์ สถิติ , Datamining , Machine Learning หรือ AI ดึงข้อมูลในอดีต (Historical Data) เพื่อคัดแยกสิ่งที่ผิดปกติ (Anomaly) และ เป็นปรกติ (Normally) ออกจากกัน

ที่มา: https://www.softnix.co.th/wp-content/uploads/2020/02/1_TbUF_HTQ6jOhO8EoPnmekQ.jpeg

What is Fraud Detection?

การตรวจจับทุจริต (Fraud detection) ด้วยการวิเคราะห์หลักฐานทางสถิติ (Statistical evidence) จากการวิเคราะห์ธุรกิจ จึงควรใช้เป็นการเตือนล่วงหน้า (Early warning) ว่าน่าจะมีการทุจริต แต่ต้องมาอาศัยหลักฐานเชิงประจักษ์ (Empirical evidence) เช่น หลักฐานทางการเงิน หลักฐานทางบัญชี หลักฐานพยาน หลักฐานทางวิทยาศาสตร์อื่นๆ

ที่มา: https://news.mit.edu/sites/default/files/images/201809/MIT-Fraud-Detection-PRESS.jpg

หลังจากทำความรู้ Anomaly & Fraud Detection กันไปแล้ว ตอนนี้ทุกคนก็คงจะพร้อมที่จะรับฟังบทสัมภาษณ์ของคุณเจกันแล้วใช่มั้ยคะ

ดร.วินน์ : คุณเจแนะนำตัวเองก่อนครับ

คุณเจ : สวัสดีครับ ชื่อเจย์นะครับ ทำงานสายนี้มาได้เกือบ 3 ปีแล้วครับ ทำเกี่ยวกับ data science เกี่ยวกับ Fraud investigation ที่เครือบริษัท Telenor ที่ DTAC

ดร.วินน์ : คุณเจย์ เคยทำงานที่ปรเทศออสเตรเลีย เคยเรียนที่ประเทศออสเตรเลียมาก่อน เป็นยังไงบ้างครับกับการเรียนที่ต่างประเทศ?

คุณเจ : จบชั้นมัธยมปีที่ 3 ที่ไทย พอไปเรียนที่ต่างประเทศการเรียนด้านคณิตศาสตร์กับวิทยาศาสตร์ที่ไทยเราเน้นมากกว่า พอไปเรียนที่ประเทศออสเตรเลีย เราเลยมีความรู้มากกว่าคนอื่น

ที่มา: https://www.corporatecomplianceinsights.com/wp-content/uploads/2018/02/fraud-folder.jpg

ดร.วินน์ : ที่จริงต่างประเทศเขาน่าจะเก่งคณิตศาสตร์กับวิทยาศาสตร์มากกว่าบ้านเรา ทำไมเราถึงมีความรู้มากกว่าเขา?

คุณเจ : สิ่งที่ต่างคือ ที่ประเทศออสเตรเลีย High School เขาเน้นให้เด็กไปทางสายอาชีพที่ตัวเองชอบ เรียนเพื่อไปประกอบอาชีพ ต่างจากประเทศไทยที่เน้นให้เด็กเรียนเพื่อเข้ามหาวิทยาลัย ที่ออสเตรเลียคนเลยสนใจด้านอื่นกันมากกว่า คนที่เรียนด้านคณิตศาสตร์กับวิทยาศาสตร์จริงๆ มีค่อนข้างน้อยในระดับของ High School แล้วเขาจะไปเน้นในการ apply อย่างการเรียนเลข เขาก็จะมีเครื่องมือ มีเครื่องคิดเลขให้ ตราบใดที่ทำเป็นก็พอแล้ว ไม่จำเป็นต้องคิดเลขในหัวให้เป็น

ดร.วินน์ : แล้วอะไรคือจุดต่าง ที่ทำให้ต่างประเทศเขาคิดค้นนวัตกรรมใหม่ๆได้?

คุณเจ : มันต่างตั้งแต่ High School แล้วครับ งานกลุ่มทุกอย่าง assignment ทุกอย่าง เขาจะผลักดันในการช้ไอเดียของตัวเอง อย่างเวลาสอบภาษาอังกฤษ จะให้เขียนนิยายมาเรื่องนึง ไม่ได้ให้จำศัพท์ ไม่ได้ให้เขียนแกรมม่า อย่างสอบวิชาคอมพิวเตอร์ เขาจะให้คิดว่าอยากจะทำ software อะไรเป็นของตัวเอง ไม่ใช่ว่ามีโจทย์ขึ้นมาแล้วเราก็ตอบโจทย์

ดร.วินน์ : หมายความว่าเป็น project base ไม่ได้สอนแบบว่า fundamental?

คุณเจ : fundamental ก็ต้องเรียน แต่ว่าเวลาสอบเลื่อนขั้นจะเป็น project base การเรียน fundamental ที่เราเรียนไม่ใช่จุดที่สำคัญที่สุด จุดที่สำคัญที่สุด จะเป็น idea จะเป็น final product แล้วจุดนี้มันจะชัดมากขึ้นไปอีก เมื่อเราอยู่ในระดับมหาวิทยาลัย 1 วิชา มี project ใหญ่ มี project เล็กสัก 3 ตัว ส่งครบส่งผ่านก็คือได้เกรดเฉลี่ยที่ดี จะไม่ได้เป็นการสอบแบบของบ้านเรา

ที่มา: http://brandimports.com/BIsite/wp-content/uploads/2015/05/RDY_Cristian-Carrara-Idea.jpg

ดร.วินน์ : อย่างมหาวิทยาลัยที่บ้านเรา เรียนหลายวิชามากเลย แค่ปี 1 ก็เรียนอัด fundamental แน่นมาก แล้วที่ออสเตรเลียเป็นแบบนั้นไหมครับ?

คุณเจ : ตอนเรียนปริญญาตรีก็ค่อนข้างคล้ายกัน จะเน้น fundamental แต่พอไปเรียนระดับปริญญาโทจะค่อนข้างเปลี่ยนไปเยอะเลย

ดร.วินน์ : ระดับปริญญาโท ที่ประเทศไทยก็เน้น project นะ แล้วเราไปเรียนด้านคอมใช่มั้ย ไปเรียนต่อด้าน data ใช่มั้ย

คุณเจ : ตอนเรียนปริญญาตรี เรียนด้านวิศวะคอม ตอนที่เรียนค่อนข้างเครียด เพราะว่าตอนนั้นติดเล่นบาสด้วย ไม่ค่อยตั้งใจเรียนเท่าไหร่ แต่ว่าพอเราไปสมัครงาน แล้วเราไม่รู้จริง ก็เลยค่อนข้างหางานยาก

ดร.วินน์ : ที่ออสเตรเลียเขาแคร์เรื่องเกรดไหม หรือเขาแคร์เรื่องความรู้?

คุณเจ : เขาก็แคร์ทั้งสองอย่างนะ เกรดจะทำให้เราผ่านด้าน HR ไปได้ เพราะ HR เขาจะดูแค่ resume แต่ถ้าเราเกรดดีแล้วผ่านแล้วได้ไปสัมภาษณ์ด้าน Technical ลึกๆ แล้วเราไม่รู้จริง เขาก็ไม่เลือกเราอยู่ดี

ที่มา: https://www.experisth.com/

ดร.วินน์ : เพราะงั้นก็หางานลำบากตอนนั้น เพราะเกรดเฉลี่ยไม่สูงมาก

คุณเจ : ใช่ แล้วมีงานสมัครที่ญี่ปุ่น ก็เลยคิดว่าถือโอกาสได้ไปเที่ยวด้วย ก็เลยไปสอนภาษาอังกฤษอยู่ที่ประเทศญี่ปุ่น เพราะว่าคนที่จบจากออส ก็มีข้อดีตรงที่ว่ามีความเป็น native เขาก็เลยรับเราง่ายๆ

ดร.วินน์ : แล้วก็กลับมาเรียนวิชาอาชีพ เลยไปเรียนต่อปริญญาโท ใช่มั้ยครับ?

คุณเจ : ใช่ กลับมาเรียนต่อปริญญาโท แล้วก็ตั้งใจเรียนมากขึ้น ได้เกรดเฉลี่ยที่ดีขึ้น

ดร.วินน์ : แล้วก็ได้ Training point ได้ไปฝึกงานที่ IBM ใช่มั้ย?

คุณเจ : ใช่ครับ พอเรียนไป 1เทอม ก็ได้ไปฝึกงานที่ IBM แล้วก็ได้ทำงานอยู่ที่ IBM ทั้งหมด 6 ปี

ที่มา: https://www.siambitcoin.com/

ดร.วินน์ : คุณเจได้ไปทำงานที่ IBM เหมือนกับเป็นเจ้าของบริษัทเลย เราคิดว่าที่เมืองนอกจะทำงานกันสบายๆ ผมโทรศัพท์ไปหาน้องชายกี่ครั้งก็บอกว่าทำงานอยู่ ทำไมต้องทำงานหนักขนาดนั้น?

คุณเจ : มันคงเป็นเรื่องของ Mind set เพราะว่าต่างประเทศเขาเน้นเรื่อง quality of life เขาทำงานกัน 7 ชั่วโมงต่อวัน แล้วพอกลับไปที่บ้านเขาก็ไม่ทำงานกันแล้ว ส่วนตอนนั้นผมเป็นเด็กใหม่ไฟแรง พึ่งเข้าบริษัท ผมก็เรียนรู้ทุกอย่าง

ดร.วินน์ : เหมือนกับคุณเจอยากจะแก้ตัวในอดีตไหม ที่เราเคยทำพลาด?

คุณเจ : ก็ไม่เชิงนะครับ แต่ว่าส่วนนึงเวลาเรา IBM เรามีความรู้ด้าน fundamental โปรแกรมที่เรียนมา แต่เราไม่มีความรู้ด้าน specifics project สมมติเขาจ้างให้เราไปสร้างระบบให้โรงพยาบาล เรารู้วิธีการเขียนโปรแกรมแต่เราไม่รู้เลยว่าที่โรงพยาบาลมีข้อมูลอะไรบ้าง เวลาเริ่มต้น มีเวลาให้เราเรียนรู้งานใหม่ๆ

เสริม คำว่า fundamental หมายความว่า พื้นฐานนะคะ

ที่มา: https://www.winvesta.in/wp-content/uploads/2021/01/Fundamental-Analysis.png

ดร.วินน์ : ตอนนั้นบอกว่ามีพนักงานใหม่ๆเข้ามาทำงานที่ IBM เหมือนกับคุณเจ แต่ว่าไม่ได้รับ assign ให้เขาไปทำงาน project ทำไมคุณเจถึงโดดเด่นได้รับให้ทำ project

คุณเจ : ต้องบอกว่า Technical skill เป็น high demand บริษัท IBM จะเป็น big company ด้าน IT ในปี 1990 แต่พอเขาเริ่มขาย Notebook ให้ Lenovo บริษัทก็เปลี่ยนเป็นด้าน business consulting เพราะว่า business consulting ได้กำไรมากกว่าด้าน IT คนที่เป็นแค่ project manager ไปคุยงาน requirements ไป presentation เงินมันมหาศาลมาก

ดร.วินน์ : หมายความว่า รับงานแล้วก็ไปเอา sources แล้วก็ส่งให้บริษัทอื่นทำ?

คุณเจ : ไม่ถึงกับเอา sources สมมติถ้าลูกค้าเป็น big company เขาก็จะจ้างบริษัทนึงทำด้าน IT จ้างอีกบริษัทนึงทำ business เพราะฉะนั้นคู่แข่งที่ใกล้ที่สุดของ IBM ก็คือ Accenture ที่ Australia สมมติว่าจ้าง Accenture ให้ทำ testing จ้าง IBM ให้ทำ development บริษัท IBM ก็เลยเล็งเห็นว่าทำไมเราต้องใช้เวลานานในการ development แต่ได้รายรับไม่เยอะมาก แต่ด้าน business กลับได้เงินมหาศาล

ที่มา: https://www.popticles.com/wp-content/uploads/2020/11/Business-Planning.jpg

ดร.วินน์ : แล้วก้าวมาทำในเรื่องของ AI ได้ยังไงครับ?

คุณเจ : ตอนนั้นทำงานที่บริษัท business ได้สัก 5 ปี แล้วทาง IBM เขาก็ผลักดัน watson

ดร.วินน์ : คือ watson เป็น AI ของ IBM หรอครับ?

คุณเจ : ใช่ แล้วเขาก็ release ระบบ watson แชทบอทขึ้นมา แล้วพี่วินก็ทำแชทบอท อยู่ใชมั้ยครับ ผมเลยขอทีมไปช่วย explore watson

ดร.วินน์ : คุณเจคิดว่าอะไรที่ทำให้บริษัท IBM มีชื่อเสียง?

คุณเจ : ผมขอพูดถึงจุดที่ไม่ดีแทนจุดที่ดีแล้วกัน คือ คนที่ไปได้ไกลถึงระดับ global ไม่ใช่ด้าน IT แต่เป็นด้าน consultant มากกว่า ความคิดส่วนตัวคิดว่าบริษัท IBM กำลังล่ม คนเก่งๆก็เริ่มออกจากบริษัทกัน

ที่มา: https://connectlearning.co.uk/

ดร.วินน์ : คุณเจระหว่างกำลังหางาน ก็ได้มาช่วยงานที่บอทน้อย แล้วก็ได้งานที่ Telenor ตำแหน่ง Data forensics เล่าได้มั้ยว่าตอนที่ interview เราเจอโจทย์อะไรบ้าง ทำไมเขาถึงรับทั้งๆที่เราก็ไม่เคยทำ forensics ไม่เคยทำ data

คุณเจ : ตอน interview เขาให้โจทย์มาข้อนึงว่า เขามี invoice file ของบริษัท มี data ของบริษัทของการรับส่งเงิน แล้วมี vendors มี invoice แล้วเขาก็หยิบ data มาให้ก้อนนึงแล้วถามว่ารายจ่ายตรงไหนมีปัญหา ตอนนี้ก็ทำอยู่ด้าน financial ปีนี้มีอะไรที่ผิดปกติไหม

ดร.วินน์ : ครับ ก็เป็นหน้าที่ของ เขาเรียกว่าอะไรนะ Forensics data science หรือ forensics ?

คุณเจ : ที่จริงอารมณ์มันจะเหมือน financial มากกว่า

ดร.วินน์ : พูดให้เข้าใจง่ายก็คือ มันมี data ที่แปกปลอม แล้วหน้าที่ของเจคือการหาความผิดปกติใน data แล้วงานด้านนี้ต่างกับ data scientist ยังไงครับ?

คุณเจ : คิดว่าหลักๆ use case ค่อนข้างจะเจาะจง เน้นหาความทุจริต ไม่ได้เปิดกว้างแบบ data scientist แล้วแต่ละบริษัทเขาก็กำลังแข่งกันว่าใครจะโตไปได้เร็วกว่า

ดร.วินน์ : หมายความว่ายังไงครับ โตไปได้เร็วกว่า?

คุณเจ : หมายความว่าหาเทคนิคใหม่ๆเข้ามาปรับปรุงได้เร็วกว่า สมมติว่า ทุกองค์กรณ์มี investigator เขาอาจจะแค่เอา excel มาเปิดดู บางองค์กรณ์ก็ทำใน Data Science, Data Stream ที่มีข้อมูล run เข้ามาตลอดเวลา ทำให้มี automation มากขึ้น ซึ่งตอนนี้แต่ละบริษัทเขาก็แข่งขันกันอยู่

ที่มา: http://www.apu.edu.my/

ดร.วินน์ : มันมี community อย่างเช่น สอบ certificate ของด้าน forensics ก็มี certificate ใช่ไหมครับ?

คุณเจ : ของ forensics ก็มีครับ เขาเรียกว่า CFE ผมก็พึ่งสอบได้มา

ดร.วินน์ : แล้วข้อสอบของ CFE คืออะไร?

คุณเจ : มันจะเป็น Fraud ที่เขาคิดกันมานานแล้ว สมมติว่าเรื่องที่เขารู้ว่ามีการโกงกันตลอด เขาก็จะ test เรื่องนั้น

ดร.วินน์ : คือเหมือนกับว่า ที่มีอีเมลล์เข้ามาว่า คุณได้รับรางวัลอะไรแบบนี้มั้ย

คุณเจ : ใช่ แบบมีบริษัท stock โทรศัพท์หลายร้อยเครื่อง แล้วพนักงานแอบเอาโทรศัพท์ไป 1 เครื่องเขาจะทำยังไง เขาก็มีวิธีวิเคราะห์ต่างๆ

ดร.วินน์ : คิดว่าอาชีพ forensics ก็คงมีเทคโนโลยี เป็นสายที่เฉพาะทาง มีสมการเป็นของเขา แต่พอมาเป็น data science ก็จะมีการประยุกต์ใช้ machine learning เช่น การทำ clustering ได้ใช้ machine learning บ้างไหม?

คุณเจ : ได้ใช้ครับ การจัด clustering มี use case บัตรประชานปลอม ได้ data ไฟล์ภาพของบัตรประชาชนมาประมาณ 5 ล้านรูปภาพ แล้วก็ run clustering แล้วก็ได้กลุ่มภาพที่เหมือนกันออกมาประมาณ 200 รูป

ที่มา: https://media-exp3.licdn.com/

ดร.วินน์ : เป็นรูปภาพเดียวกันหมดเลยหรอ?

คุณเจ : เป็นรูปภาพที่คล้ายกัน แต่ไม่ได้เหมือนกันหมด เช่น บัตรประชาชน มีการใช้ Photoshop แก้ไขเลขบัตรประชาชน เพราะฉะนั้น clustering ก็เลยดึง data ออกมาได้เร็วมาก

ดร.วินน์ : คือหมายความว่า รูปภาพเป็นรูปเดียวกันแต่เลขบัตรประชาชนไม่เหมือนกันหรอ เพราะเขาก็คงคิดว่าระบบใช้ OCR ในการ register

คุณเจ : ใช่ๆ

ดร.วินน์ : สุดยอดมาก เป็น use case ที่เห็นภาพมากเลยครับ ก็คือสกัด feature ของรูปภาพ แล้วเราไม่ได้ดูแค่ OCR แต่เราดูทุกองค์ประกอบ ก็เลยจับมารวมกันอยู่ใน cluster เดียวกัน

คุณเจ : ก่อนหน้าที่จะนำ AI มาใช้ เขาก็ใช้ Data Analytics มาก่อน ดูข้อมูลจาก database แล้วใน database ก็จะเห็นแต่เลขบัตรประชาชนที่ไม่เหมือนกัน แต่เขาก็ทำอะไรไม่ได้

ที่มา: https://www.ko.in.th/wp-content/uploads/2020/07/data-1024x1024.jpg

ดร.วินน์ : เรื่องนี้มันเป็นเรื่องใหม่ในวงการ forensics ไหม หรือมีคนทำอยู่แล้ว?

คุณเจ : เป็นเรื่องใหม่ที่อย่างน้อย Telenor ก็ไม่เคยเห็น แล้วทางผู้บริหาร ทาง CEO เขาก็ประทับใจ

ดร.วินน์ : อยากให้แชร์ use case ของปากีสถานที่มีความน่ากลัวนิดนึงครับ?

คุณเจ : เวลาพูดคำว่า forensics คือการดึงข้อมูลเพื่อนำไปใช้ในเชิงกฎหมายได้

ดร.วินน์ : คือเวลาที่เราจะดึงข้อมูล เราต้องขออณุญาติเขาว่าเราจะตรวจคอมพิวเตอร์เขาใช่มั้ยครับ?

คุณเจ : มันเป็น case by case ครับ ถ้าไม่ใช่เรื่องใหญ่เราก็จะบอกเขาก่อน

ดร.วินน์ : แล้ว case ที่ปากีสถาน เราไป surprise เขาเลยหรอครับ?

คุณเจ : ของ case ที่ปากีสถาน ไป surprise เขา คือถ้าประเทศปากีสถานจะไป surprise ตลอด ข้อมูลในคอมพิวเตอร์มันไม่ค่อยมีปัญหาเพราะว่ามันก็เป็น 100% ของบริษัทเขา แต่ถ้าเป็นโทรศัพท์มือถือ ถึงบริษัทเขาจะ issue ให้มันก็ยังมีข้อมูลส่วนตัวเยอะ ผมก็เริ่ม process ไปได้ชั่วโมงนึง ระหว่างนั้นเจ้าของเครื่องเขาก็ไปคุยกับเพื่อนเขาที่เป็นนักกฎหมายที่ปากีสถาน แล้วเขาก็มาบอกผมว่า คุณไม่มีสิทธิ์มาเอาข้อมูลในโทรศัพท์มือถือ แล้วก็บอกว่า personal data เป็นเรื่องร้ายแรงมาก ตอนนั้นผมก็ตัดสินใจเลิกเลย ไม่ทำแล้ว แต่ผมก็ไม่เข้าใจว่าทำไมเขาถึงมีปัญหาทั้งๆที่เขาเซ็นยินยอมเรื่องแล้ว ปีที่ผ่านมาผมก็เปลี่ยนมาเน้นเรื่อง data online กับ data ใน system มากขึ้น office 365 ก็เป็น domain ใหม่ที่ผมต้องดู

ที่มา: https://www.kdnuggets.com/wp-content/uploads/analytics-suite.png

จบกันไปแล้วสำหรับบทสัมภาษณ์คุณเจ วรวุฒิคุณชัย จากคอร์สเรียน Data Science Essential#3 ของ BOTNOI หวังว่าทุกคนจะได้รับความรู้เกี่ยวกับอาชีพสาย Data Science ด้าน Fraud investigation และประสบการณ์การทำงานดีๆจากคุณเจ สำหรับใครที่สนใจคอร์สเรียนดีๆ Data Science Essential รุ่นที่ 4!! ของ BOTNOI join group ได้ที่ -> FB Page Botnoi AI & Data science classroom หรือจิ้มที่ลิงค์เลย https://www.facebook.com/groups/2421985951170978/

Botnoi AI & Data science classroom | Facebook

--

--