Econometrics คืออะไร?

Thasvarit Kruerklai
Quant CU
2 min readMay 31, 2024

--

บทความนี้เกิดจากการอ่านสไลด์สอน Econometrics สำหรับเด็ก ป.ตรี ของ Jonathan Roth แล้วรู้สึกว่าเค้าเรียบเรียงดีอยู่นะ เลยเอามาเขียนสรุปครับ

econometrics คือวิชาที่เหมือน stats toolbox ตัวหนึ่ง ที่เค้าใช่ตอบคำถามสาย econ กันจาก data (คนที่มี background เศรษฐศาสตร์แล้วย้ายไปทำ data science มักจะบอกว่านี่คือวิชาที่มีประโยชน์ที่สุดสำหรับการทำงาน, สำหรับสาย quant ผมรู้สึก toolbox นี้เป็นตัวเลือกนึงที่ต้องรู้จัก ก็เลยกำลังอ่านนี่แหละ)

โดยคำถามที่ว่าจะมีใหญ่ ๆ อยู่ 3 ประเภท คือสาย descriptive ที่จะถามว่าสิ่งนั้นสิ่งนี้ในโลกจริงมันเป็นยังไง ซึ่งเพราะเอาจริง ๆ เราไม่สามารถเก็บ data จาก population ทั้งหมดได้ มันเยอะ มีเยอะละก็เก็บยาก ดังนั้นเราต้องเก็บมาแค่บางส่วนแทน เรียกว่าเก็บ sample โดยยากที่สุดของการตอบคำถามประเภทนี้ คือเก็บยังไงให้ sample represent population (เพราะถ้าไม่ represent บับ เช่นถามว่าช่วงนี้พี่ปวดขามั้ยกับคนไทยทุกคนกับคนไทยที่อายุ 60 ขึ้นไป ผลมันก็ต้องต่างกันอยุ่แล้วใช่ม้า ถ้าไม่ represent ผลมันก็ไม่ตรง ก็มั่ว)

มุกจากในสไลด์หน้า 11 วาดโดย xkcd https://www.explainxkcd.com/wiki/index.php/2618:_Selection_Bias

ถัดมาคือสาย causal ความหมายก็ตรงตัวเลยคือการตั้งคำถามว่าแล้วอะไรล่ะที่เป็นเหตุเป็นผลกัน ก็ลองเดาดู โดยสายนี้ยากกว่า descriptive ซะอีก เพราะประกอบด้วย 2 components คือมีของฝั่ง descriptive component ด้วยหนึ่ง (ถ้าเกิด A แล้วจะมีผลกับ B แบบนี้) และมีอีกอย่างคือ counterfactual component (ถ้าไม่เกิด A แล้ว B จะเป็นแบบนี้) ในการทำงานจริง ก่อนอื่นเราจะลองเดาดูว่ามีเหตุ (estimator) อะไรบ้างที่จะส่งผลกับผล (estimand)

ตัวอย่างของสาย causal คือเช่นสมมติเราให้ d เป็นตัวกำหนดว่าเราเรียนที่มหาลัยอะไร (ในสไลด์เค้าว่า if D = 1 คือเรียนจบที่ Brown, if D = 0 คือเรียนจบที่ URI) ส่วน if Y = 1 ก็คือ earnings จากการเรียนที่ Brown, if Y = 0 คือ earnings จากการเรียนที่ URI ถ้าเราอยากรู้ causal effect (ภาษาคนคือ causal relationship อันนี้ความสัมพันธ์มันแรงขนาดไหน) ว่าเรียนที่ไหนให้ผลต่างกันยังไง เราก็จะเอา E[Y(1) I D=1] — E[Y(0) I D=0] พูดเป็นภาษาคนคือเอา earnings ของคนจบ Brown มาลบกันคนจบ URI ว่าได้เท่าไหร่ อันนี้อะคือเคส descriptive component (เราเรียกการเอา mean มาลบกันแบบนี้เท่ ๆ ว่า average treatment effect)

แต่ประเด็นคือบางทีมันจะมีเคส counterfactual ด้วย ที่เราต้องแคร์ เช่น E[Y(1) I D=0] ซึ่งมันจะอิหยังวะหน่อย เหตุคือการเรียนจบ URI แต่ผลคือ earnings จากการเรียนจบ Brown …ซึ่งเอาจริงมันเป็นไปไม่ได้ กาว คน 1 คนมันเลือก experience ได้แค่แบบเดียว เราเลยต้อง setup การทดลองเพื่อสู้กับความกาวนี้

สไลด์หน้า 18

gold standard ของการทดลองที่ว่าคือสิ่งที่เรียกว่า randomized controlled trial (RCT) แต่ช่างมัน ในทางปฏิบัติหลายครั้งเราทำ RCT ไม่ได้ เค้าเลยว่าคลาสนี้จะมาคุยกันว่าแล้วถ้ารัน RCT ไม่ได้แล้วทำไงดี

คำถามสายสุดท้ายอันที่ 3 คือการ forecast แต่ในสไลด์นี้เค้าก็ไม่ได้ขยายความอะไรเรื่องนี้นะ

วาร์ป access สไลด์
https://github.com/jonathandroth/Econ1630_Github/tree/master?fbclid=IwZXh0bgNhZW0CMTAAAR0oG8GAwd6RQz86NdBlXc_3lTEw_c1-lHlcoGU0JhiZlaV1rf0_IN3jdiw_aem_AceqxyWi8It-TNk6Wc-RThljgvzoFbQUoQeRh3823oMHrdvWYfb53QfJnH2njOmtuUk3ZNrq104ovqa9Md1pkHQN

ปล. ถ้ามีตรงไหนแหม่ง ๆ feel free to correct me นะ!

--

--

Thasvarit Kruerklai
Quant CU

engineering student with interests in math modeling.