สวัสดีครับ ในบทความชุดนี้เราจะมาทำความรู้จักกับ architecture ใหม่ล่าสุดในแวดวง deep…
ในตอนนี้เราจะมาพูดถึง Attention Module ซึ่งถือเป็นหัวใจหลักของ Transformer กันครับ
ในตอนที่ 3 นี้เราจะมาดู Transformer แบบเต็มๆ กันครับ
Self-Attention ดีกว่าวิธีอื่นอย่างไร และทำไมถึงต้องมาใช้ Self-Attention ในตอนนี้เราจะมาว่ากันครับ
การใช้ Self-Attention เพียวๆ นี้ดีอย่างไร…
สวัสดีครับ ในบทความชุดนี้เราจะอธิบายถึงการใช้ RNN มาเรียนรู้แบบจำลองภาษาระดับอักขระ…
แบบจำลองภาษา (language model) ในที่นี้ คือ probabilistic model ที่รับเป็น sequence เข้ามา แล้วดูว่ามีความน่าจะเป็นที่ sequence นี้จะอยู่ในภาษาที่แบบจำลองเรียนรู้มามากน้อยแค่ไหน…