GPT4 มีอะไรน่าสนใจบ้างนะ

Navee Sratthatad
SET-IT-TEAM
Published in
4 min readMar 18, 2023

GPT-4 ที่เพิ่งเปิดตัวมามีอะไรบ้าง มีอะไรน่าสนใจบ้าง มาไล่ดูพร้อมกัน

ก่อนจะพูดถึง GPT-4 หลายๆคนส่วนใหญ่น่าจะได้ยินมาบ้างกับ ChatGPT หรือบางคนก็อาจจะได้เล่นแล้วแต่อาจจะยังไม่รู้ที่มาที่ไป ก็ขอให้ลองไปอ่านที่บทความเดิมก่อนหน้า ถ้าพอรู้อยู่แล้วก็อ่านต่อได้เลยครับ

https://medium.com/set-it-team/gpt-vs-chatgpt-5dc75407478

GPT 4 มีอะไรใหม่บ้าง

เมื่อวันที่ 14 มีนาคม 2023 ที่ผ่านมา OpenAI ได้เปิดอีกขั้นของปัญญาประดิษฐ์ ก็คือ GPT-4 ที่เรียกได้ว่าพัฒนาขึ้นจาก GPT-3 อย่างมาก เรามาดูสิ่งที่เพิ่มขึ้นมากัน

https://openai.com/product/gpt-4

GPT-4 can solve difficult problems with greater accuracy, thanks to its broader general knowledge and problem solving abilities.

  1. ความคิดสร้างสรรค์และ Collaboration มากขึ้น สามารถให้ทำ Task ที่ซับซ้อน, Creative อย่างเช่น ประพันธ์เพลง, แต่งบท ได้ดีขึ้น หรือแม้กระทั่งเขียน Writing โดยดูจาก Style การเขียนของเรา
  2. Visual Input เรียกได้ว่าเป็น Highlight เลย จากเดิมที่รับได้เพียงข้อความเท่านั้น ตอนนี้ GPT-4 ได้ยกระดับไปสามารถรับ Input เป็นรูปภาพได้ เช่นให้รูปไปแล้วให้อธิบายว่ารูปนั้นเป็นอย่างไร

3. Context ที่ยาวขึ้น รับ Input ได้ยาวขึ้น ซึ่งตอนนี้รับได้ 25,000 คำ (GPT — 3.5 8,000 คำ)

GPT-4 surpasses ChatGPT in its advanced reasoning capabilities.

นอกจากนี้หากเอาไปเทียบกับ ChatGPT สามารถให้เหตุผลได้ดีขึ้นอย่างมาก

หากดูฝั่งซ้ายจะเห็นได้ ChatGPT ยังตอบผิดอยู่ ตอบนอกเหนือจากช่วงที่ให้ไป

GPT-4 outperforms ChatGPT by scoring in higher approximate percentiles among test-takers.

นอกจากนี้เมื่อเราใช้ GPT-4 ไปลองสอบตามที่ต่างๆ เรียกได้ว่าคะแนนสูงขึ้น

จากตัวอย่างจะเห็นว่าเค้าได้ให้ไปลองสอบ Uniform Bar Exam (การสอบเนติบัณฑิตมาตรฐานอเมริกา) ซึ่งได้คะแนนอยู่ใน Rank Percentile สูงขึ้น เรียกได้ว่าไปอยู่ท๊อปๆ เลย หรือแม้กระทั่ง ชีววิทยาโอลิมปิก ก็ยังทำได้

Partner

มีหลาย Application ที่เริ่มไปใช้ Model ของ GPT-4 แล้วเช่น Duolingo

Steerability

โดยปกติแล้ว ChatGPT จะมี Personality ของ AI ที่ค่อนข้างจำกัด จากนี้ไปเราสามารถกำหนดพฤติกรรมของ AI ได้ รวมทั้งการควบคุมว่าอยากให้เค้าเป็นแบบไหน เค้าจะทำตาม Task ของเราโดยตั้งอยู่บน System ที่เรากำหนดไป

ตัวอย่างที่เค้ากำหนดให้มี Personal แบบโจรสลัดที่รักในกวี แล้วมอบหมาย Task ให้เค้าไป

Risks & mitigations

ในด้านความปลอดภัย และ ข้อมูลที่ Sensitive ตัว GPT-4 เทรนโดยยึดจุดนี้มากขึ้นมากๆ โดยเชิญ ผู้เชี่ยวชาญกว่า 50 สาขา เช่น cybersecurity, biorisk มาช่วยทดสอบ เพื่อป้องกันคนมา Request ข้อมูลที่ไม่ดี โดยรอบนี้สามารถลดการดึงข้อมูลที่ไม่พึงประสงค์ 82% เทียบกับ GPT-3.5

GPT-4 Developer Livestream

นอกจากการประกาศมาในเว็บแล้ว ยังมี Livestream Demo สดๆ ให้ดูด้วย โดยผู้ Demo ก็คือ Greg Brockman, President and Co-Founder of Open AI

Greg Brockman : President and Co-Founder of Open AI

โดยเค้ามีตัวอย่าง Demo ให้ดูหลายตัวเลย โดยผมจะเล่าถึง 3 อันที่ดูว้าวๆละกัน

ซึ่งเค้าจะมี Program Playground ที่เชื่อมต่อกับ GPT-4 อยู่ในการ Demo

#1 AI Assistant ช่วย Program

โดยเค้ากำหนด System ให้กับ AI ในการช่วยอ่านโค้ด แล้วก็คิด Step ต้องทำอะไรบ้างเป็นโค้ดแบบจำลอง (Pseudocode) แล้วสุดท้าย แปะโค้ดที่สามารถใช้ Run ได้จริงให้

โดยโจทย์เค้ากำหนดให้ทำ Discord Bot ที่รับ Input ทั้ง Text หรือ รูปภาพแล้วกำหนด Task ให้ Bot ทำตามจาก Input นั้น โดยใช้ข้อมูลจาก GPT-4

Discord Bot

โดยเค้าได้บอกไว้เนื่องจาก Data Train มันจะสิ้นสุดช่วง 2021 แน่นอนว่า Discord API มันมีเปลี่ยนเรื่อยๆอยู่แล้ว ก็อาจจะพังได้ แล้วก็ตัว API อ่านรูปเพิ่งเพิ่มมาในปี 2022

ก็เลยจะมีการแปะ การทำ API อ่านรูปให้ Bot ไว้ด้วย เรียกว่า Cool อีกแล้ว นอกจากจะมีข้อมูลอดีตแล้ว ยังสามารถเรียนรู้สดๆ จาก Text ที่แปะไปให้

ซึ่งระหว่าง Demo ก็จะพบปัญหาหลายอย่าง จากที่กล่าวไปคือ API เปลี่ยน หรือว่า Syntax ไม่ถูกเนื่องจากใช้โปรแกรมรันไม่ถูกเวอร์ชั่น ซึ่งเค้าสามารถแปะ Error Code ไปเลย โดยตัว AI จะสามารถแก้ปัญหาได้เอง เช่นแก้ Code ให้ตรงเวอร์ชั่น

มีความเจ๋งอยู่ช่วงหนึ่งคือ Bot ไม่สามารถรับรูปได้ โดยคุณ Greg ได้ดูมาแล้วแหละว่า API มันต้องมีส่ง Parameter เพิ่ม ซึ่งเป็นของที่เพิ่มมาใน API ปีหลังๆ ซึ่งเป็นส่วนที่ AI ไม่รู้เนื่องจากไม่มีข้อมูล ซึ่งเค้าได้แก้ปัญหาโดยวิธีการสุดเจ๋ง ก็คือ Copy Document ทั้งก้อนแปะไปเลย

ภาพการไป Copy Documentation ของ Pycord เรียกว่ากด Ctrl+A เอาไปหมด
แปะ Text Document เละๆ เลย

ผลปรากฏคือ AI สามารถแก้ปัญหาได้ตามที่คิดเลย โดยดูจาก Document ที่เราส่งให้แบบเละๆ

#2 ทดสอบพลัง Image Input กับการทำเว็บจากรูป

คุณ Greg ได้ลองเอารูป Mockup ที่เค้าทำในไว้ในสมุดเค้า เพื่อให้ AI ช่วยออกแบบเว็บให้ โดยถ่ายรูปสมุด และขอให้ AI ช่วยทำเว็บหน้าตาแบบในรูปที่ถ่ายมาให้ ซึ่งปรากฏว่าสามารถทำออกมาเป็นเว็บหน้าตาแบบนั้นได้จริงๆ จากดินสอเขียนร่างๆแบบรูป

Mockup จากโน้ต

#3 ทดสอบให้ทำ Task ยากๆที่ไม่ค่อยมีคนอยากทำ ก็คือทำ Tax Code

เนื่องจากผู้เขียนไม่ได้เป็นคนอเมริกา อาจจะยังไม่ค่อยเข้าใจเท่าไหร่ แต่เท่าที่ฟังคือเป็นการทำเรื่องภาษีแหละ โดยปกติแล้วเค้าจะต้องมานั่งอ่านเอกสารยาวเหยียดเกี่ยวกับ Tax Code ว่ามีเงื่อนไขอะไรบ้าง ต้องจ่ายอะไรยังไง

โดยคุณ Greg กำหนดให้ AI อ่าน Tax Code ทั้งหมด แล้วอธิบายให้เข้าใจง่ายทุก Detail ทุกขั้นตอนว่าต้องจ่ายอะไรยังไง ในระดับที่คนมาอ่านเพื่อยืนยันความถูกต้องได้

ก็เลยจัดไป คุณ Greg แปะไปเลย Tax Code 16 หน้าเต็มๆ !!

กำหนด Rule, คำถาม, ข้อมูล Tax Code

แน่นอนว่า AI สามารถสรุปออกมาอย่างง่ายๆ เป็นข้อๆเลย เป็นคำตอบพร้อมเหตุผล

คุณ Greg บอกว่าก่อนจะลองให้ทำโจทย์นี้ เค้าลองทำเองกว่าครึ่ง ชม. แล้วก็ยังไม่ได้

แม้แต่จุดที่ถ้าทำเองบางทีเค้ายังคิดไม่ถึงก็ยังแปะมาให้ครบพร้อมเหตุผลประกอบตาม System ที่เค้าตั้งไว้ว่าต้องมี Detail เป็น Step ง่ายๆ เพื่อให้คน Verify ได้

ปัจจุบัน GPT-4 ยังไม่ได้เปิดใช้เต็มที่ อีกทั้ง Feature Image Input ก็ยังพยายามปรับปรุงร่วมกับ Partner อยู่ เลยยังไม่ได้เอาออกมาให้ใช้สาธารณะ ณ วันนี้

แต่ถ้ามีผู้ที่สนใจอยากลอง GPT-4 แบบ Text สามารถไปลองใช้ผ่าน ChatGPT-Plus ได้สำหรับผู้ที่เสียเงินรายเดือน ซึ่งตอนนี้ยังเปิดทดลองให้ใช้แบบจำกัดจำนวนใช้อยู่ ส่วนผู้ใช้ฟรีต้องรอคอยไปก่อนอาจจะมีเปิดให้ในอนาคต

GPT ถูกเริ่มพัฒนามาตั้งแต่ 2018 แล้วออกมาเป็นแอพพลิเคชั่นที่ดังๆก็คือ ChatGPT ช่วงปลายปี 2022 รวมๆแล้วก็ประมาณ 5 ปี ถือว่าสั้นมาก โลกเปลี่ยนไวทุกวัน ถ้าเราไม่เตรียมพร้อม ก็อาจจะตามไม่ทันได้

Reference

  1. https://www.youtube.com/watch?v=outcGtbnMuQ
  2. https://openai.com/product/gpt-4
  3. https://openai.com/research/gpt-4
  4. https://www.theverge.com/2023/3/15/23640047/openai-gpt-4-differences-capabilties-functions
  5. https://lifearchitect.ai/chatgpt/

--

--