Smart Trader’s Diary

cway investment
cw-quantlab
Published in
2 min readDec 1, 2018

บทความนี้จะมาอัพเดต งานวิจัยพัฒนาโปรเจค Deep Coach กัน ซึ่งโปรเจคนี้เป้าหมายคือการพัฒนา AI เพื่อนำมาใช้วิเคราะห์พฤติกรรมการเทรด ของเทรดเดอร์ เพื่อช่วยปรับปรุงและสนับสนุนการฝึกพัฒนาทักษะของเทรดเดอร์ ในการเทรด

โดยส่วน Smart Trader Diary ในบทความนี้เป็นการทำระบบที่ใช้การวิเคราะห์พฤติกรรม การแสดงความคิดเห็นและอารมณ์ของเทรดเดอร์ ผ่าน Trader Diary ที่เทรดเดอร์ที่จะใช้ในการจดบันทึกผลการเทรดและภาวะตลาด รวมถึงการสิ่งที่เกิด คล้าย Logbook นั้นเอง

ความท้าทายคือเราจะใช้เทคนิคการวิเคราะห์ข้อมูลขั้นสูงด้วย Deep Learning มาใช้ประมวลผลข้อความ(Text) ในเอกสาร Trader’s Diary ซึ่งเป็นข้อมูลจำนวนมากที่เกิดในแต่ละวัน เพื่อวิเคราะห์พฤติกรรมและมุมมองของเทรดเดอร์ด้านอารมณ์ การตอบสนองต่อเหตุการณ์ที่เกิด แปลงข้อมูลเข้าสู่ระบบเพื่อใช้วิเคราะห์ และออกคำแนะนำ รวมถึงประมวลผลร่วมกับ Trading record เพื่อสร้างคำแนะนำและโซลูชั่นในการแก้ไขพฤติกรรมของเทรดเดอร์แบบเฉพาะบุคคล

การทำงานระบบ Smart Trader Diary ประกอบด้วย 3 ส่วน ได้แก่

1. ส่วนการประมวลผลข้อมูลประเภทประโยคและข้อความ:

การทดลองนี้ใช้ Natural Language Processing จุดนี้ท้าทายดีเพราะเทรดเดอร์จดบันทึกเป็นภาษาไทย ดังนั้นกระบวนการ NLP จำเป็นต้องใช้การวิเคราะห์และประมวลผลภาษาไทย ตรงนี้ การทดลองได้ใช้ส่วนของ PyThaiNLP ในการทำ word tokenization และการทำ text vectorization รองรับกระบวนการ Extracting features เพื่อนำข้อมูลไปประมวลผลต่อ

ตัวอย่าง Text ในบันทึก diary ที่เข้าสู่การประมวลผล

จากการทดลองกับข้อมูล trader diary จำนวนหลายหมื่นประโยค พบว่า PyThaiNLP ทำงานได้ดี ในระดับที่น่าพอใจ

2. การจำแนกคำและข้อความ(Text Classification)

การทดลองนี้ใช้ Universal Language Model Fine-tuning (ULMFiT) สร้างการจำแนกคำ เพื่อใช้การหาความสัมพันธ์และความคล้ายคลึง

ข้อมูล Text ในประโยคผ่านการทำ word tokenization และสร้าง wordcloud

3. การวิเคราะห์ข้อความ

กระบวนการนี้ใช้ Deep learning ในการประมวลผลข้อมูล ซึ่งผมใช้ Long Short-Term Memory(LSTM) เป็นโมเดลการเรียนรู้ที่สอนให้ AI รู้จักคำจากประโยค รวมถึงสามารถวิเคราะห์เชิง sentimental และสามารถจำแนกความไม่ปกติที่ซ่อน จากกลุ่มข้อความในเอกสาร

ภาพตัวอย่างการทำ Text Classification ด้วย Convolutional Neural Network (CNN) ซึ่งปัจจุบันเป็นเทคนิคที่ได้ความนิยมและมีประสิทธิภาพ

ทดลองออกแบบโมเดลเป็นลักษณะ Sequence to Sequence model ใช้ลักษณะของข้อมูลก่อนหน้ามาร่วมประมวลผลเพื่ออนุมานผลลัพธ์ล่าสุดที่เกิดด้วย ดังนั้นมันจึงมีมิติเรื่องของความสัมพันธ์ระหว่างกัน เข้ามาร่วมวิเคราะห์ ซึ่งตรงนี้แทนจะใช้แค่ Recurrent Neural Networks(RNN) แค่โหนดสั้นๆ เราทดลองใช้ LSTM เพื่อเพิ่มประสิทธิภาพและความแม่นยำของโมเดล (ไม่ขอลงรายละเอียดตรง LSTM นี้มากสนใจอ่านได้จากลิงค์ด้านล่าง)

การเทรน LSTM ใช้ข้อมูล Diary จากเทรดเดอร์อาสาสมัครที่จดบันทึกทุกวัน ตลอดระยะเวลา 3 เดือน พร้อมการเทรด ทำให้มีข้อมูล Trading record พร้อม diary ประกอบ

ตัวอย่างโมเดลแรก สำหรับ sentiment analaysis ที่ทดลองกับ dataset

นอกจากนี้ยังมีการสร้าง word database พิเศษเพื่อใช้ในการ classification และการทำ tokenization เพราะบางคำศัพท์ด้านการเทรด การลงทุน เหมือนแสลง ที่ไม่มีใน corpus ทั่วไป เช่น ตกรถ,หุ้นปั่น,ติดดอย, ถัวดอย, ล้างพอร์ต เป็นต้น

การทดลองนี้ทำการเทรนโมเดล LSTM บน Tensorflow ซึ่งใช้ GPU ของ Google Cloud Platform ผลการทดลองพัฒนาโมเดลเฟสแรกมีความแม่นยำระดับที่น่าพอใจ

AI จะทำการประเมินทั้งด้านอารมณ์ และเป้าหมายเฉพาะ เช่นระดับความมั่นใจ และระดับความวิตกกังวล จุดนี้พยายามสังเกต ความไม่ปกติ จากพฤติกรรม รูปแบบประโยค เช่น การใช้ข้อความบางประเภท ลักษณะการเขียนที่วกวน เป็นต้น

การทดลองนี้ช่วงเริ่มต้น ยังต้องพัฒนาความถูกต้องและความแม่นยำในการประเมิน สร้าง performace score เพื่อใช้อ้างอิงเป้าหมาย ใช้เพื่อติดตามและวิเคราะห์พฤติกรรมเทรดเดอร์ ร่วมกับการประเมินผลการเทรด กำไร ขาดทุนที่เกิด ต่อไป..

--

--