Econometrics คืออะไร?
บทความนี้เกิดจากการอ่านสไลด์สอน Econometrics สำหรับเด็ก ป.ตรี ของ Jonathan Roth แล้วรู้สึกว่าเค้าเรียบเรียงดีอยู่นะ เลยเอามาเขียนสรุปครับ
econometrics คือวิชาที่เหมือน stats toolbox ตัวหนึ่ง ที่เค้าใช่ตอบคำถามสาย econ กันจาก data (คนที่มี background เศรษฐศาสตร์แล้วย้ายไปทำ data science มักจะบอกว่านี่คือวิชาที่มีประโยชน์ที่สุดสำหรับการทำงาน, สำหรับสาย quant ผมรู้สึก toolbox นี้เป็นตัวเลือกนึงที่ต้องรู้จัก ก็เลยกำลังอ่านนี่แหละ)
โดยคำถามที่ว่าจะมีใหญ่ ๆ อยู่ 3 ประเภท คือสาย descriptive ที่จะถามว่าสิ่งนั้นสิ่งนี้ในโลกจริงมันเป็นยังไง ซึ่งเพราะเอาจริง ๆ เราไม่สามารถเก็บ data จาก population ทั้งหมดได้ มันเยอะ มีเยอะละก็เก็บยาก ดังนั้นเราต้องเก็บมาแค่บางส่วนแทน เรียกว่าเก็บ sample โดยยากที่สุดของการตอบคำถามประเภทนี้ คือเก็บยังไงให้ sample represent population (เพราะถ้าไม่ represent บับ เช่นถามว่าช่วงนี้พี่ปวดขามั้ยกับคนไทยทุกคนกับคนไทยที่อายุ 60 ขึ้นไป ผลมันก็ต้องต่างกันอยุ่แล้วใช่ม้า ถ้าไม่ represent ผลมันก็ไม่ตรง ก็มั่ว)
ถัดมาคือสาย causal ความหมายก็ตรงตัวเลยคือการตั้งคำถามว่าแล้วอะไรล่ะที่เป็นเหตุเป็นผลกัน ก็ลองเดาดู โดยสายนี้ยากกว่า descriptive ซะอีก เพราะประกอบด้วย 2 components คือมีของฝั่ง descriptive component ด้วยหนึ่ง (ถ้าเกิด A แล้วจะมีผลกับ B แบบนี้) และมีอีกอย่างคือ counterfactual component (ถ้าไม่เกิด A แล้ว B จะเป็นแบบนี้) ในการทำงานจริง ก่อนอื่นเราจะลองเดาดูว่ามีเหตุ (estimator) อะไรบ้างที่จะส่งผลกับผล (estimand)
ตัวอย่างของสาย causal คือเช่นสมมติเราให้ d เป็นตัวกำหนดว่าเราเรียนที่มหาลัยอะไร (ในสไลด์เค้าว่า if D = 1 คือเรียนจบที่ Brown, if D = 0 คือเรียนจบที่ URI) ส่วน if Y = 1 ก็คือ earnings จากการเรียนที่ Brown, if Y = 0 คือ earnings จากการเรียนที่ URI ถ้าเราอยากรู้ causal effect (ภาษาคนคือ causal relationship อันนี้ความสัมพันธ์มันแรงขนาดไหน) ว่าเรียนที่ไหนให้ผลต่างกันยังไง เราก็จะเอา E[Y(1) I D=1] — E[Y(0) I D=0] พูดเป็นภาษาคนคือเอา earnings ของคนจบ Brown มาลบกันคนจบ URI ว่าได้เท่าไหร่ อันนี้อะคือเคส descriptive component (เราเรียกการเอา mean มาลบกันแบบนี้เท่ ๆ ว่า average treatment effect)
แต่ประเด็นคือบางทีมันจะมีเคส counterfactual ด้วย ที่เราต้องแคร์ เช่น E[Y(1) I D=0] ซึ่งมันจะอิหยังวะหน่อย เหตุคือการเรียนจบ URI แต่ผลคือ earnings จากการเรียนจบ Brown …ซึ่งเอาจริงมันเป็นไปไม่ได้ กาว คน 1 คนมันเลือก experience ได้แค่แบบเดียว เราเลยต้อง setup การทดลองเพื่อสู้กับความกาวนี้
gold standard ของการทดลองที่ว่าคือสิ่งที่เรียกว่า randomized controlled trial (RCT) แต่ช่างมัน ในทางปฏิบัติหลายครั้งเราทำ RCT ไม่ได้ เค้าเลยว่าคลาสนี้จะมาคุยกันว่าแล้วถ้ารัน RCT ไม่ได้แล้วทำไงดี
คำถามสายสุดท้ายอันที่ 3 คือการ forecast แต่ในสไลด์นี้เค้าก็ไม่ได้ขยายความอะไรเรื่องนี้นะ
ปล. ถ้ามีตรงไหนแหม่ง ๆ feel free to correct me นะ!