อะไรทำให้เพลงฮิตในปี 2017–2018? อธิบายด้วย Data จาก Spotify

Kamin Phakdurong
5 min readJun 21, 2018

--

อะไรทำให้เพลงฮิต คำถามสั้นๆที่ตอบโคตรยาก เราเคยคุยเรื่องนี้กับพี่โฟ 25 Hours ตอนไปอัดเพลงที่บ้านพี่เขา

“ไม่รู้เลยว่ะ ยุคนี้”

.

“เพลงไหนที่คิดว่าน่าจะโดนแน่ๆ แป๊กซะงั้น”

.

พอดีว่าเทอมนี้ที่ MIT ได้ลงเรียนวิชาด้าน Data Science ไปบ้างก็เลยเกิดร้อนวิชา อยากลองเอามา analyze data ดูบ้าง

เผื่อว่าผสมกับประสบการณ์การทำ การคุย กับเพื่อนๆพี่ๆศิลปินที่รู้จักแล้วอาจจะมีอะไร make sense ขึ้นมาบ้าง

คิดๆดูแล้วทำไมมันยากงี้ฟะ เลิกเป็นศิลปินแล้วไปขายก๊วยเตี๋ยวน่าจะง่ายกว่า

แต่เอาเหอะ ช้าไปแล้วต๋อยเอ๋ย

ทุกอย่างเริ่มที่การตั้งคำถาม

อะไรทำให้เพลงดัง?

Branding ของศิลปิน

พี่นิค เจ้าของค่าย Genie Records เคยกล่าวไว้ใน Podcast ชื่อ The Secret Sauce ของ The Standard (ตลกตรงที่เราก็เด็กในค่าย แต่ยังไม่เคยคุยกับแกเป็นการส่วนตัว เลยต้องมาฟังแกพูดทาง podcast แทน)

.

ศิลปินยุคนี้ จริงๆไม่ได้ขายเพลง แต่ขาย Branding

เพลงมีขึ้นได้ลงได้ ปล่อยเพลงใหม่ออกมาไม่ดังไม่เป็นไร แต่ Branding ต้องขึ้นเท่านั้น

อือหือ โดนไปเลยเต็มๆ

การโปรโมท

อย่างที่สองที่เราๆรู้กันดีคือ การโปรโมท เพราะปฏิเสธไม่ได้ว่าเพลงคือส่วนสำคัญในสังคมมนุษย์ มันคือสิ่งที่เชื่อม เป็นเหมือนอารมณ์ร่วมของคน ของ culture ในแต่ละยุคสมัย

บางคนใช้คำว่า Music is the fabric of society

เพราะงั้นการกระจายให้เพลงถูกเปิดในทุกๆที่ย่อม influence เราไม่มากก็น้อย

การโปรโมทในยุคนี้อาจไม่ใช่แค่การที่คลื่นวิทยุ (ซึ่งส่วนใหญ่มักมีค่ายเพลงใหญ่เป็นเจ้าของ) เปิดบ่อย แต่รวมถึงการถูก recommend/curate โดย music streaming platform เช่น Spotify, Joox หรือ YouTube เป็นต้น

Network Effect

หรือการที่คนในวงรอบตัวเราพูดถึงเพลงใดเพลงหนึ่ง (หรือศิลปิน) บ่อยๆ ซึ่งก็ตั้งอยู่บนเหตุผลเดียวกับข้อสอง แต่โดยประสบการณ์ส่วนตัวเป็นสิ่งที่สร้างยากที่สุด organic ที่สุด และ effective ที่สุด

ทั้งนี้ทั้งนั้น ข้อสุดท้ายที่ศิลปินสามารถควบคุมได้มากที่สุดก็คือ

.

(รัวกลอง)

.

ตัวเพลงนั่นเอง!

ซึ่งถ้าเราดูแค่ว่าอะไรในเพลงที่ทำให้คนชอบก็น่าจะต้องคุยกันยาว

เมโลดี้? เนื้อเพลง? คอร์ด? จังหวะ? ซาวด์? พูดยาก

แต่ก็นั่นแหละ เราจะลองหาคำตอบดู ซึ่ง data ที่เราดึงมา อาจจะ focus ไปที่ตัวเพลง อย่างเดียวก่อน ถึงจะไม่ใช่ทั้งหมดของคำตอบ แต่ก็น่าจะทำให้เข้าใจอะไรมากขึ้น

…มั้ง

Data เอ๋ย เจ้ามาจากไหน

ก่อนอื่น เริ่มจากดึง open data จาก spotifycharts.com ซึ่งเราสามารถโหลด list เพลงที่ติดชาร์ต Top 200 แบบรายสัปดาห์ในรูปของไฟล์ CSV ซึ่งสำหรับชาร์ตในประเทศไทยน่าจะมีข้อมูลย้อนไปถึง สิงหา 2017 ที่ Spotify Thailand เพิ่งเปิดตัว

สิ่งที่น่าสนใจคือ Spotify API ที่เขาเปิดให้ประชาชีดึงข้อมูลอื่นๆของเพลงต่างๆออกมาได้

ที่น่าสนใจคือสิ่งที่เรียกว่า Audio Features

Audio Features คือ “Character” ของเพลงที่ Spotify ใช้คอมพิวเตอร์ analyze เพลงทุกเพลงบน platform และทำการให้คะแนนในแต่ละด้าน

ตัวอย่างเช่น

Danceability มีค่าตั้งแต่ 0.0 ไปจนถึง 1.0 เป็นตัวอธิบายว่าเพลงนี้มีความง่ายต่อการทำให้คนเต้นขนาดไหน ภาษาบ้านๆคือความ “ดีด” หรือ “โจ๊ะ” นั่นแหละ โดยจะดูจาก tempo จังหวะ ความแข็งแรงของ beat อะไรประมาณนั้น

หรืออย่าง Energy ที่ถ้าแปลในภาษานักดนตรีที่มีความรู้น้อยแบบเราก็ต้องเรียกว่าความ “พุ่ง” ของเพลง โดยจะดูจากความเร็ว ดัง (หรือความหนวกหู) ของเพลงนั่นเอง ตัวอย่างเช่น จิ๊จ๊ะของ Silly Fools อาจจะได้คะแนนในหมวดนี้สูงในขณะที่เพลงชิวๆแบบ ตุ๊กตาหน้ารถ ของ Lula จะได้คะแนนต่ำหน่อย

แต่ทั้งนี้ทั้งนั้น คะแนนสูงไม่ได้แปลว่าดี ต่ำไม่ได้แปลว่าไม่ดี อย่าลืม มันเป็นแค่ “Character” ของเพลง

ทีนี้ มัน tricky ตรงที่ว่าข้อมูลเพลงมันมีเยอะมาก จะมานั่งไล่ดึงก็ขี้เกียจ เราเลยเขียน script เพื่อดึงข้อมูลทั้งหมด เสร็จแล้วเอามารวมกัน ได้ไฟล์ CSV หน้าตาแบบนี้ น่ารักไหมจ๊ะ

ว่าแล้วก็ลองดูเพลงตัวเองหน่อย (tie in เบาๆ)

เอ้า เต้นสิครับ รออะไร

ถึงเวลา explore data

เนื่องจากส่วนใหญ่เพลงฮิตติดชาร์ตในแต่ละอาทิตย์มักจะเป็นหน้าเดิมๆ เราเลยต้องทำการคัดเพลงซ้ำออกก่อนที่จะเริ่ม analyze

ระหว่างนี้ ใครยังไม่ได้เข้าห้องน้ำรีบไปเข้า เตรียมยูกยา หรือจะเดินไปซื้อกาแฟ Starbucks แก้วละ 200 บาทมากินไปอ่านไปก็ไม่ว่ากัน เพราะเรากำลังจะเข้าสู่เขตแดนของ nerd!

พร้อม?

เอ้าลุย!

ก่อนอื่น ขอเจาะ Audio Features หรือ “Character” ของเพลงในแต่ละด้านที่ Spotify analyze มาก่อน ซึ่งมีทั้งหมด 12 ตัว โดยที่เราทำ feature engineering แถมให้อีก 4 ตัว กลายเป็น 16 ตัว อันประกอบด้วย

Danceability คือความดิ้น หรือความเต้นของเพลงอย่างที่ได้กล่าวไป ให้คะแนนจาก 0.0 ไปถึง 1.0 โดยดูที่ tempo, การย่ำจังหวะ, ความแข็งแรงของ beat เป็นต้น

Energy คือพลัง หรือความพุ่งของเพลง จาก 0.0 ถึง 1.0 ดูจากความเร็ว ความดัง และความหนวกหูของเพลง นอกจากนี้ยังดูพวก dynamic range ของเพลง, ความวุ่นวาย, หรือดูเสียงเครื่องดนตรีบางประเภทเช่นกลอง กีต้าร์เสียงแตก ไรงี้

Key คือ key signature ของเพลง แต่เพื่อเพิ่มความงง ค่าที่ออกมาจะเป็นตัวเลขโดย 0 คือ C, 1 คือ C# หรือ Db และก็ไล่ไปเรื่อยๆ

Loudness คือความดังในหน่วย decibel ไม่ใช่ความดังแบบ popular ซึ่งจะเป็นค่าเฉลี่ยตลอดทั้งเพลง ตรงนี้ต้องระวังนิดหน่อย เพราะความรู้สึกว่าดัง (หรือ perceptual loudness) ของเพลงอาจจะต่างกับความดังที่เป็นค่าเฉลี่ยออกมา อย่างไรก็ตาม เพลงส่วนใหญ่จะมีค่าเฉลี่ยตั้งแต่ -60 ไปจนถึง 0 db

Mode คือ major หรือ minor โดยดูจาก scale ของตัว melody หลัก minor แทนด้วย 0 ในขณะที่ major แทนด้วย 1

Speechiness หรือความพูดมากของเพลง 555 อันนี้เขาจับเฉพาะเสียงที่เป็นเหมือนคนพูด (หรือ rap) ไม่ใช่เสียงร้องที่เป็นเมโลดี้ โดยทั่วไปเพลงที่ไม่มีท่อน rap จะมีค่าต่ำกว่า 0.33 ส่วนเพลงที่มีค่าอยู่ที่ประมาณ 0.33–0.66 คือเพลงที่น่าจะมีท่อน rap ผสมอยู่ ถ้ามากกว่า 0.66 ก็น่าจะเป็นพวก podcast หรือ audiobook

Acousticness คือความ “acoustic” ของเพลง อันนี้จะ define ชัดๆเป็นภาษาเขียนก็อาจจะยาก เอาเป็นว่าถ้าอารมณ์เพลงแบบ ตีคอร์ดหยอดสาวด้วยกีต้าร์โปร่งตัวเดียว ก็น่าจะมีค่า acousticness สูงหน่อย

Instrumentalness อันนี้คือความน่าจะเป็นที่เพลงนี้เป็นเพลงบรรเลง

ปล. สำหรับเสียงจำพวก ปาดับปา โว้วโวว ลัลลัลลัล จะถูก Spotify มองเป็นเครื่องดนตรี ไม่ใช่เสียงร้องนะครับ

Liveness คือความสดของดนตรี ถ้าเป็นเพลงที่เพิ่งถูกจับมากินตอนที่ยังสดๆอยู่ ก็จะมีค่า Liveness สูง ถุย!

อันนี้คือมันจะดูว่าเพลงเป็นแนวพวกบันทึกการแสดงสดไหม โดยมันจะพยายามมองหาเสียงกริ๊ด เช่น ถ้ามีเสียง กริ๊ดดดด! พี่เป็กผลิต! ไรพวกนี้ก็จะได้คะแนน Liveness สูง

Valence อันนี้คือประจุความโลกสวยของเพลง ตั้งแต่ 0.0 ถึง 1.0 ถ้าเพลงฟังดูแล้วสนุกสนาน ลัลลา ก็จะได้คะแนนสูง แต่ถ้าเป็นเพลงดราม่า โอดครวญ ฉันเหมือนคนที่โดนเธอแทงข้างหลังแล้วมันทะลุถึงหัวใจ ไรงี้ก็จะคะแนนน้อยหน่อย

Tempo ตรงตัวเลย Tempo จังหวะเร็วช้าขนาดไหน หน่วยเป็น bpm

Time Signature บอกว่าเพลงเป็นจังหวะแบบไหน 4/4, 6/8 บลาๆ

ทีนี้ ด้วยความขยันจัด เราเลยเพิ่มให้อีก 4 ตัวคือ

Key+Mode ซึ่งเกิดจากการรวม Key กับ Mode เข้าด้วยกัน ตัวอย่างเช่น กลายเป็น key C Major, A minor เป็นต้น

Past Artist in Top 200 ดูว่าเจ้าของเพลงเคยติดขาร์ตใน Top 200 ไปกี่เพลง

Past Artist in Top 50 ดูว่าเจ้าของเพลงเคยติดขาร์ตใน Top 50 ไปกี่เพลง

Past Artist in Top 10 ดูว่าเจ้าของเพลงเคยติดขาร์ตใน Top 10 ไปกี่เพลง

แฮ่กๆๆ ยินดีด้วย ถ้าคุณอ่านจบถึงตรงนี้ กรุณาปรบมือให้ตัวเอง เพราะเรากำลังจะเข้าเรื่องจริงๆแล้ว (เดี๋ยวนะ นี่ยังไม่เริ่มอีกเรอะ!?)

บทวิเคราะห์ จากผู้ (ไม่) เชี่ยวชาญ

ทีนี้ เราก็ plot พวก histogram และ scatter plot เพื่อดูหน้าตาของ dataset ว่าเบ้ซ้าย เบ้ขวา เบ้หน้า เบ้หลัง เบ้พร้อมๆกัน (พอ!) หรืออย่างไร

Danceability, Energy, Loudness

ผลปรากฏว่า Danceability, Energy และ Loudness ของเพลงฮิตที่ติดชาร์ต Top 200 ค่อนข้างเบ้ไปทางซ้าย แปลว่า เพลงที่ติดชาร์ตส่วนใหญ่ มักมีความเต้น energy สูงๆ และเสียงดัง

ข้อมูลอันนี้จริงๆก็ตรงกับประสบการณ์ตรงพอสมควรนะ

.

คนทำเพลงด้วยกันมักพูดติดตลกว่า

ยิ่ง mix เพลงให้ดังเท่าไร เพลงยิ่งดังเท่านั้น

Key, Mode, Key Signature

สำหรับ key ของเพลง ค่อนข้างไม่มี pattern ตายตัว ที่ตลกคือพอเราลองดู data แล้ว Key ของ Spotify ก็ไม่ได้ตรงขนาดนั้น เช่นอย่างเพลง หากค่ำคืน ของวงเรา The Dai Dai อยู่ใน Key F Major แต่ Spotify บอกว่าอยู่ใน Bb Major

อย่างไรก็ตาม key ที่ฮิตที่สุดคือ

แท่มแทมแท๊ม C Major นั่นเอง!

ส่วน Time Signature ค่อนข้างเป็นเอกฉันท์เพราะเพลงแทบจะ 100 ทั้ง 100 เป็น 4/4 มีส่วนประหลาดๆหลุดมาด้วย คือ 5/8

.

นับยังไงฟะ

Liveness, Acousticness, Instrumentalness

พอ plot ออกมาหน้าตาค่อนข้างทุเรศพอสมควรเพราะค่าส่วนใหญ่กระจุดอยู่ที่ใกล้ 0 มากๆ แต่ถ้าสรุปแบบเข้าใจง่ายๆคือ กราฟบอกว่า เพลงฮิตส่วนมากไม่ใช่บันทึกการแสดงสด ไม่ค่อย Acoustic และก็ไม่ใช่เพลงบรรเลง

yeah…right…

Tempo

topic นี้น่าสนใจเพราะก็เป็นสิ่งที่คนทำเพลงพูดถึงกันประมาณนึงว่า จังหวะเท่าไรถึงจะดีด ถึงจะโดน

ผลปรากฏว่าค่าเฉลี่ย tempo อยู่ที่ 119 ซึ่งเห้ย สำหรับเพลงไทย 119 นี่ถือว่าเร็วนะ พอไปนั่งเจาะ outlier ถึงได้รู้ว่ามีหลายเพลงที่ Spotify analyze ผิด เช่น คนที่คุณก็รู้ว่าใคร ของพี่แสตมป์ที่ tempo 200 ในขณะที่ tempo จริงๆอยู่ที่ 100

อันนี้ก็เข้าใจได้เพราะตัว Spotify อาจจะไปมองจังหวะตกเป็น sub division ทำให้กลายเป็น double time ไป ให้อภัยๆ

แต่ทั้งนี้ทั้งนั้น ก็ทำให้ค่าเฉลี่ยนของ tempo คลาดเคลื่อนพอสมควร

Number of Songs from the Same Artist in Top 200/50/10 Charts

อันนี้น่าสนใจเพราะศิลปินส่วนใหญ่ที่มีเพลงติดชาร์ต ก็มักจะมีมากกว่า 1 เพลงที่เคยติดชาร์ต Top 200 อยู่แล้ว อย่างศิลปิน Top 10 นี่จะมีเพลงอยู่ในชาร์ตอยู่แล้วโดยเฉลี่ยประมาณ 9.8 เพลง!

เรียกว่าน่าจะ confirm ข้อสันนิฐานที่ว่า Branding ศิลปินมีผลเยอะ ความดังของศิลปินส่งเสริมให้เพลงดังได้ง่ายกว่าศิลปินหน้าใหม่

แล้วไงต่อ?

ถึงแม้ว่าข้อมูลจะค่อนข้างตรงกับ sense เรา แต่จุดนี้เรายังรู้สึกว่าข้อมูลมันยังกว้างๆไปหน่อย

step ต่อไปเราน่าจะลองสร้าง predictive model ดูว่าเราสามารถทำนาย rank ในชาร์ตของเพลงจาก Character ของเพลงได้ไหม

*อัพเดท

ตอนนี้เราทำอธิบายเพิ่มเติมไว้ที่ 2 ลิ้งนี้
http://bit.ly/2LPwl9m
http://bit.ly/2NHyapx

โปรดติดตามตอนต่อไป!

ใครมีอะไรแนะนำ หรืออยากให้เจาะตรงไหนบอกได้นะครับ อยากทำให้มีประโยชน์สำหรับทุกคน ใครรู้สึกว่ามีประโยชน์ฝาก share ด้วยนะครับ ขอบคุณครับ

Kamin Phakdurong (คามิน)
เรียนโทอยู่ MIT. Co-founder Drivebot. มือ Synthesizer วง The Dai Dai (Genie Records).
http://kaminph.com

--

--

Kamin Phakdurong

Co-founder at LOOK ALIVE Studio (MIT based Startup) and a band member of The Dai Dai (Genie Records)