ในโลกลงทุน เราจะเห็นการใช้สถิติ เข้ามาจับ อธิบายพฤติกรรมการเคลื่อนไหวของราคาหุ้น โดยนักคณิตศาสตร์มองการเคลื่อนไหวของหุ้นบนหลัก stochastic คือประกอบไปด้วย 1 mean ขึ้นลงตามค่าเฉลี่ย + 2 random drift คืออารมณ์ประมาณว่า เออ ก็ไม่รู้มันจะไปทางไหน เหมือนเป็น error term
ซึ่งเรื่องนี้ เป็นที่ถกเถียงว่า มาก่อน normal distribution หรือมาหลัง แต่ในปัจจุบัน ในศาสตร์ของ quants จะ based จาก normal distribution
แล้ว Normal Distribution คืออะไร ?
Normal Distribution ชื่อไทยคือ การแจกแจงแบบปกติ มีอีกชื่อหนึ่งคือ Gaussian Distribution
จริงๆแล้วมันไม่ได้แจกแบบปกติ เพราะเป็นการกระจายโอกาสความน่าจะเป็นแบบสมมาตร โดยมีกึ่งกลางคือค่าเฉลี่ย ยิ่งข้อมูลใกล้ค่าเฉลี่ย ยิ่งมีจำนวนมาก และค่อยๆลดลง เมื่อออกห่างจากค่าเฉลี่ย
โดยหลักเเล้วจะประกอบไปด้วย
- mean คือค่าเฉลี่ยของข้อมูล ซึ่งในกรณี normal distribution เเล้ว มันจะ represent ค่าเฉลี่ยของข้อมูลของเรา
- standard deviation หรือ std ซึ่งเป็นตัววัดว่าข้อมูลนั้นๆกระจายตัวอย่างไรรอบๆค่าเฉลี่ย หรือก็คือข้อมูลมันเเผ่ออกไปมากน้อยเเค่ใหน ซึ่งในหลักการของ stochastic อย่างง่ายเอง เราใช้ std นี่เป็นพื้นฐานของ random drift
เข้าใจแล้ว ก็มาเรียนรู้วิธีอ่านค่า และความหมายของมันกัน
คนที่ใช้เรื่องนี้เป็น จะพูดได้ทันทีว่า พอร์ต หรือสินทรัพย์ต่างๆ มันจะเคลื่อนไปแถวไหน โอกาสกี่ % ตามหลักสถิติในอดีต เช่น มีโอกาส 70% โดยประมาณที่จะเคลื่อนไหวในช่วง -10% ถึง 20% มีโอกาส 2.5% ที่จะขาดทุนมากกว่า -20%
มายังไง? ง่ายๆคือการดูตาราง ดูกราฟ normal distribution แล้วอิงไปตาม mean และ std
ลองดู 2 รูปนี้ก่อนครับ ว่าคล้ายกันไหม
หากเรานำผลตอบแทนรายปี มาวางในกราฟ ให้แกน x เป็นผลตอบแทน แกน y เป็นจำนวนครั้ง จะพบว่ามันใกล้เคียงกับ normal distribution แต่ตรงกลางโด่งหน่อย
สำหรับ normal distribution นั้น
ในช่วง 1 ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย (std) จะครอบคลุมโอกาสความน่าจะเป็นร้อยละ 68.2) ในช่วง 2 ส่วนเบี่ยงเบนมาตรฐาน คือร้อยละ 95.4 ซึ่งจากที่กล่าวมาอาจดูเป็นเรื่องธรรมดา เเต่ที่จริงนี่เป็นรากฐานของสถิติจำนวนมากที่สำคัญเลยแหละครับ
เรามาดูการเเจกเเจงกับข้อมูลหุ้นจริงๆกันดีกว่า
The Pyramid of Equity Returns
จากรูปด้านบน พอมองคร่าวๆก็ดูเหมือน Normal Distribution ใช่มั้ยครับ เเต่ความจริงเเล้วมันยังไม่เข้าเกณฑ์ของ Normal Distribution หรือที่เรียกว่า “เเนวโน้มเข้าสู่ศูนย์กลาง” (central tendency) นั่นเอง โดยเราจะดูง่ายๆว่า mean (ค่าเฉลี่ย) = median (ค่ากลาง) = mode (ค่าที่มากที่สุด) หรือไม่ และยังมีเรื่องอื่นๆอีก เช่น
โดย Standard Normal Distribution จะมี
- ความโด่งของข้อมูล (kurtosis) = 3
- ความเบ้ของข้อมูล (skewness) = 0
- ค่าเฉลี่ย = 0
- ส่วนเบี่ยงเบนมาตรฐาน = 1
เราอาจเคยเห็น Normal Distribution ที่ตัวเลขผิดแปลกไปจากนี้ แต่ก็ยังอยู่ในนิยามของ normal distribution (สังเกตดีๆ ก่อนหน้าผมเติมคำว่า standard) เข้าไป หากไปใช้ function excel หรือ python ก็ระวังๆดีๆนะครับ 555
แต่ถ้าเราดู distribution ของตลาดหุ้นจริงๆ จะเห็นว่าข้อมูลมันเยอะๆเอียงทางด้านขวา ไม่ใช่ตรงกลาง (เบ้ซ้าย) ไม่ได้สมมาตรกันทั้ง 2 ด้าน เหตุผลเพราะผลตอบเเทนมันมักจะเป็นขาขึ้น
ด้วยเหตุนี้ ทำให้เราไม่สามารถใช้ทฤษฏีเเนวโน้มเข้าสู่ศูนย์กลาง (central tendency) เเทนค่า std เพื่อหาความน่าจะเป็นได้นั่นเอง เเต่มันก็ไม่ได้ไม่มีประโยชน์ซะทีเดียว
รูปด้านบนเป็นกราฟข้อมูลผลตอบเเทนรายปีของดัชนี s&p500 จำนวนทั้งหมด 200 ปี พอดูเเล้วมันก็เป็นรูประฆังคว่ำสูงๆ นั่นแปลว่า ช่วงตรงกลางมีการจับกลุ่มของข้อมูลที่สูงในช่วงตรงกลาง (kurtosis สูง) ในขณะที่ผลตอบเเทนก็มีช่วงของการเปลี่ยนแปลงขึ้นลงที่มาก ไปจนถึง -50% ถึง +60% เลยทีเดียว (ถึงเเม้โอกาสจะเกิดน้อยก็ตาม) ซึ่งสังเกตุได้จากหางที่ยาวเเละเเบนนั่นเอง (fat tail) หรือบ้างก็เรียกว่า black swan, tail risk
คอร์สสุดคุ้ม FullBundle ที่จะสอนให้คุณเขียน Python เพื่อการลงทุนได้อย่างมืออาชีพ https://bottomliner.co/investic-course-bundle/
Investic