เปรียบเทียบ ChatGPT vs Gemini vs Claude ใครเจ๋งสุด? ณ เดือนเมษายน 2024

Published in

LINE Developers Thailand

4 min readApr 26, 2024

สวัสดีครับทุกคน เพื่อเป็นการเฉลิมฉลองการมาถึงของ Loading Animation API ที่มันคือ Animation แสดงข้อความ . . . (อารมณ์ Now loading) ที่หลายคนรอคอย เอาไว้เวลา Chatbot ของเรากำลัง Generate คำตอบอยู่ เพิ่มประสบการณ์ใช้งาน Chatbot ให้ดีย์งามมากขึ้น วันนี้ผมมีบทความเปรียบเทียบว่า ChatGPT vs Gemini vs Claude ว่า ณ วันนี้เดือนเมษายนปี 2024 ใครเจ๋งกว่าใครกันครับ!

พี่ตี๋เขียนบทความไว้แล้วนาจา ตามไปตำกันได้เลยยยย

Disclaimer: บทความนี้ผมนำเนื้อหามาจาก website ชื่อ spiceworks.com ชื่อบทความว่า Top Three LLMs Compared: GPT-4 Turbo vs. Claude 3 Opus vs. Gemini 1.5 Pro เขียนโดยคุณ Sumeet Wadhwani
เพิ่งออกเลยครับ สดๆร้อนๆวันที่ 18 April 2024 ที่ผมเอาล่าสุดมาเลยเพราะว่า GenAI มันเปลี่ยนเร็วมากครับ ทุกๆ 2–3 week มันมี Upgrade มาละ เดือนหน้ามันอาจจะเปลี่ยนแล้วก็ได้ ต้องตามตลอดครับผม

Brief History

ในบทความเริ่มต้นที่ประวัติศาสตร์ชาติ AI เล็กน้อยนะครับ มันจะคล้ายๆ 3 ก๊กเหมือนกันนะครับ 55+ ย้อนกลับไปในเดือนพฤศจิกายน 2022 ก๊กแรก บริษัท OpenAI (ที่ Microsoft ถือหุ้นและสนับสนุนอยู่) เปิดตัว ChatGPT ซึ่งเป็นแชทบอท GenAI ที่ Based-on มาจากโมเดล Generative Pre-Trained Transformer 3.5 (GPT-3.5) พอเปิดตัวมาก็เรียกว่าคือ ‘Wow ซ่า’ เลยฮิตติดลมบนสุดๆ โดย

มีผู้ใช้ 1 ล้านคนภายใน 5 วันแรกที่เปิดตัว
มีนักพัฒนาไปใช้ API 2 ล้านคนใน 1 ปี
ณ เดือนมีนาคม 2024 มีผู้ใช้ 180.5 ล้านคน

ตัดภาพมาที่ก๊กที่สอง Google บ้าง ถือว่าเป็นก๊กเก่าแก่ด้าน AI ที่เราใช้ Google Assistant มาหลายปี แต่อยู่ๆพอ ChatGPT ก็มา แล้วมันได้ภาพจำไปเต็มว่า GenAI คือ ChatGPT หัวหน้าก๊ก Sudar Pichai บอก ‘ไม่ได้การ เราต้องผลักดันเรื่อง AI เต็มที่ละ’ ก็เปิดตัว Bard ตามมาในเดือนมีนาคม 2023 (4 เดือนหลังจาก ChatGPT) ซึ่งยังไม่ปังเท่าที่ Google ต้องการ แต่เค้าก็พัฒนาต่อมาเรื่อยๆจนเดือนกุมภาพันธ์ 2024 ทำการ Rebrand Bard ใหม่เลยมาเป็น ‘Gemini’ ซึ่งเจ๋งขึ้นเยอะมาก แต่ในบทความบอกว่าส่วนแบ่งการตลาดยังคงอยู่ที่ ChatGPT 4 Turbo อยู่ครับ

ผมสร้างรูปจาก API ของ DALL·E 3 Prompt “Robot wars, The Romance of the Three Kingdoms, Hero flighting, Marvel studio style” รูปสวยมากกกก

ข้ามมาอีกก๊ก ช่วงมีนาคม 2023 อีกบริษัท Anthropic (ที่สนับสนุนจาก Amazon และ Google) ก่อตั้งโดยอดีตรองประธาน OpenAI (เหมือนนายทัพย้ายก๊ก ยังไงยังงั้น 55+) ก็เปิดตัว Claude AI อีกตัว ซึ่งก็มาแรงเหมือนกัน ความสามารถสู้กันกับ ChatGPT ได้เลย

เรียกได้ว่าตอนนี้โลก Generative AI มี 3 ก๊กนี้เป็นผู้นำนั่นเองครับ ถัดไปในบทความจะเปรียบเทียบ GenAI ทั้ง 3 ตัวไปในแต่ละหัวข้อๆครับ

1. AI benchmarks

การวัดประสิทธิภาพของ AI ตามมาตราฐานยอดนิยมต่างๆ คือแต่ละ Benchmarks มันจะมี Standard ในการทดสอบที่เฉพาะเจาะจงของแต่ละค่ายไป เช่น Benchmark ตัวนี้วัดความเป็นเหตุเป็นผล วัด Coding skills ซึ่งมันก็จะมีรายการการทดสอบและ Dataset เอาไว้เป็นเครื่องมือประเมินผลในการวัดเป็นเรื่องๆไป ผมหยิบมาให้ดูกันบางตัวครับ

ถ้าดูตาม Benchmark คร่าวๆ เหมือน GPT-4 Turbo จะเหนือกว่าเล็กน้อยครับ

2. Knowledge cutoff

คือวันที่ที่ AI สามารถเข้าถึงข้อมูลได้

Gemini 1.5 Pro: Online
GPT-4 Turbo: December 2023
Claude 3 Opus: August 2023

ด้วยพลังของ Google ถือว่า Gemini ได้เปรียบที่สุดเพราะมันสามารถเข้าถึงข้อมูลแบบ Online ได้เลย ถ้าเราถามอะไรที่เพิ่งออกปีนี้มันจะฉลาดมากครับ ตัวอย่างเช่น ผมลองไปถามเรื่อง Loading Animation API ของ LINE ที่เพิ่งออกไม่ถึงสัปดาห์ ตัว Gemini มันก็สามารถให้ข้อมูลได้อย่างถูกต้องด้วย!

3. Language support

Gemini 1.5 Pro รองรับ 38 ภาษา
GPT-4 Turbo รองรับ 26 ภาษา
Claude 3 Opus รองรับ 12 ภาษา

เรื่องภาษายังไว้ใจ Google ได้ ณ วันนี้เค้ารองรับมากที่สุด แต่จากที่เราเห็น Feedback ของผู้ใช้งานในไทย Claude 3 นี่คนจะชมเยอะมากว่ามันเก่งภาษาไทยจริงๆ ช่วยแปลได้ดีมากๆ เข้าใจบริบท สามารถใช้ภาษาไทยได้สวยและเป็นธรรมชาติ Gemini ก็โอเคเหมือนกัน แต่ ChatGPT ภาษาไทยคนจะบ่นเยอะน่าจะยังตามหลังที่สุดครับ

4. Context window

จำนวนข้อมูลสูงสุดที่ AI สามารถประมวลผลได้ อารมณ์เป็น Short-term memory ที่เข้าถึงได้ทันที ซึ่งเรื่องนี้สำคัญสำหรับองค์กรแบบ Enterprise เพราะบางทีเค้าต้อง Process Document เยอะๆหรือ Dataset ใหญ่ๆ เพื่อที่จะทำการสรุปหรือวิเคราะห์ เพราะฉะนั้นการที่ AI มันยังจำได้และเข้าใจบริบทได้นาน จะแสดงถึงความฉลาดของมันครับ

GPT4 Turbo ประมวลผลได้ 128,000 Tokens เทียบได้กับหนังสือประมาน 450 หน้า
Gemini 1.5 Pro ได้ 128,000 Tokens เช่นกัน แต่ที่สิ่งที่น่าสนใจคือ Google ได้อนุญาตให้นักพัฒนาและลูกค้าองค์กรทดลองใช้ Token ได้มากสุดถึง 1 ล้าน Tokens ได้ด้วย
Claude 3 Opus ได้ถึง 200,000 Tokens แต่ก็สามารถขอได้ถึง 1 ล้าน Tokens เหมือนกัน เป็นกรณีๆไป

5. การทดสอบทาง IQ

การทดสอบ IQ คือการวัดความฉลาดทางสติปัญญา เช่น การวิเคราะห์แยกแยะ การใช้เหตุผล/ตรรกะ และการแก้ปัญหา (IQ เฉลี่ยๆของคนปกติคือ 100)

Claude 3 Opus มีไอคิวสูงกว่าค่าเฉลี่ยของมนุษย์ IQ ที่ 101 (OMG!)
GPT-4 Turbo มีคะแนน IQ อยู่ที่ 85
Gemini Advanced ที่ 76 คะแนน (Note: อาจจะมีข้อมูลแค่ตัว Advanced เพราะเค้าไม่ได้เอาคะแนนตัว 1.5 Pro มา)

ในบทความให้ความเห็นว่าจริงๆมันไม่ควรวัด IQ แบบมนุษย์เพราะ IQ มันเอาไว้ทดสอบมนุษย์! แม้ว่า GenAI และ Neural network ของมันจะถูกออกแบบมาเพื่อเลียนแบบมนุษย์ แต่ความสามารถทางปัญญาเพื่อเอามาทดสอบ IQ ไม่น่าดีเท่าคน (แต่ขนาดไม่ดีเท่า ก็แซงไปแล้ว 55+)

6. Pricing

ทุกคนคงรู้เนอะว่า GenAI คิดเราเป็น Token คร่าวๆก็คือถ้าเป็นภาษาไทย 1 ตัวอักษรก็คือ 1 Token

Google ถูกที่สุดเลย ณ วันนี้ยังสามารถใช้งานได้ Gemini 1.5 Pro ได้ Free แต่วันที่ 2 พฤษภาคม 2024 จะเริ่มเก็บเงินแล้วครับ (แงง)โดย Gemini 1.5 Pro ในราคา $7 / 1 ล้าน Input Tokens และ $21 / 1 ล้าน Output Tokens ซึ่งก็ยังถูกที่สุดอยู่ดี
GPT-4 Turbo คิดที่ $10 / 1 ล้าน Input Tokens และ $30 / 1 ล้าน Output Tokens (แพงขึ้นมานิด)
Claude 3 Opus แพงที่สุดอยู่ที่ $15 / 1 ล้าน Input Tokens (2 เท่าของ Gemini) และ $75 / 1 ล้าน Output Tokens (3 เท่าของ Gemini เฮือก!)

สรุป

สรุปรวมๆแล้ว 3 ก๊กนี้ ณ วันนี้ยังไม่ได้มีใครชนะเด็ดขาด บางตัวอันนี้ดี บางตัวเรื่องนี้ดีกว่า คือต้องเรียกว่าสงครามเพิ่งเริ่มด้วยแหละครับ ก่อนจะจากกันผมแถมให้อีกนิด ตอนนี้ถ้าเค้าจะดูเปรียบเทียบว่า LLM ตัวไหนมันเก่งที่สุดเค้าจะ Ref กันจาก Chatbot Arena Leaderboard ครับก็คือเป็น Platform ตัวเปรียบเทียบความสามารถของ AI เหล่านี้ โดย Based on การให้คะแนนแบบ Elo rating system (ตัวอย่างคือหนังเรื่อง Social media ที่มี Algorithmให้ vote สาวๆเทียบแข่งกันไปเรื่อยๆ) เค้าจะจับ AI มาเทียบกันแบบ Head-to-Head แล้วให้คน Vote ว่าความสามารถตัวไหนเก่งกว่า แบบไม่เห็นว่าเปน AI อะไรนะครับ เพื่อทำ Ranking ว่าใครเจ๋งสุด!

อย่างที่บอกยังอีกยาวไกลครับสงครามนี้ 55+ อย่าลืมไปลองเล่น Loading Animation API ใน LINE ด้วยนะครับ!