GPT4 มีอะไรน่าสนใจบ้างนะ
GPT-4 ที่เพิ่งเปิดตัวมามีอะไรบ้าง มีอะไรน่าสนใจบ้าง มาไล่ดูพร้อมกัน
ก่อนจะพูดถึง GPT-4 หลายๆคนส่วนใหญ่น่าจะได้ยินมาบ้างกับ ChatGPT หรือบางคนก็อาจจะได้เล่นแล้วแต่อาจจะยังไม่รู้ที่มาที่ไป ก็ขอให้ลองไปอ่านที่บทความเดิมก่อนหน้า ถ้าพอรู้อยู่แล้วก็อ่านต่อได้เลยครับ
GPT 4 มีอะไรใหม่บ้าง
เมื่อวันที่ 14 มีนาคม 2023 ที่ผ่านมา OpenAI ได้เปิดอีกขั้นของปัญญาประดิษฐ์ ก็คือ GPT-4 ที่เรียกได้ว่าพัฒนาขึ้นจาก GPT-3 อย่างมาก เรามาดูสิ่งที่เพิ่มขึ้นมากัน
https://openai.com/product/gpt-4
GPT-4 can solve difficult problems with greater accuracy, thanks to its broader general knowledge and problem solving abilities.
- ความคิดสร้างสรรค์และ Collaboration มากขึ้น สามารถให้ทำ Task ที่ซับซ้อน, Creative อย่างเช่น ประพันธ์เพลง, แต่งบท ได้ดีขึ้น หรือแม้กระทั่งเขียน Writing โดยดูจาก Style การเขียนของเรา
- Visual Input เรียกได้ว่าเป็น Highlight เลย จากเดิมที่รับได้เพียงข้อความเท่านั้น ตอนนี้ GPT-4 ได้ยกระดับไปสามารถรับ Input เป็นรูปภาพได้ เช่นให้รูปไปแล้วให้อธิบายว่ารูปนั้นเป็นอย่างไร
3. Context ที่ยาวขึ้น รับ Input ได้ยาวขึ้น ซึ่งตอนนี้รับได้ 25,000 คำ (GPT — 3.5 8,000 คำ)
GPT-4 surpasses ChatGPT in its advanced reasoning capabilities.
นอกจากนี้หากเอาไปเทียบกับ ChatGPT สามารถให้เหตุผลได้ดีขึ้นอย่างมาก
หากดูฝั่งซ้ายจะเห็นได้ ChatGPT ยังตอบผิดอยู่ ตอบนอกเหนือจากช่วงที่ให้ไป
GPT-4 outperforms ChatGPT by scoring in higher approximate percentiles among test-takers.
นอกจากนี้เมื่อเราใช้ GPT-4 ไปลองสอบตามที่ต่างๆ เรียกได้ว่าคะแนนสูงขึ้น
จากตัวอย่างจะเห็นว่าเค้าได้ให้ไปลองสอบ Uniform Bar Exam (การสอบเนติบัณฑิตมาตรฐานอเมริกา) ซึ่งได้คะแนนอยู่ใน Rank Percentile สูงขึ้น เรียกได้ว่าไปอยู่ท๊อปๆ เลย หรือแม้กระทั่ง ชีววิทยาโอลิมปิก ก็ยังทำได้
Partner
มีหลาย Application ที่เริ่มไปใช้ Model ของ GPT-4 แล้วเช่น Duolingo
Steerability
โดยปกติแล้ว ChatGPT จะมี Personality ของ AI ที่ค่อนข้างจำกัด จากนี้ไปเราสามารถกำหนดพฤติกรรมของ AI ได้ รวมทั้งการควบคุมว่าอยากให้เค้าเป็นแบบไหน เค้าจะทำตาม Task ของเราโดยตั้งอยู่บน System ที่เรากำหนดไป
Risks & mitigations
ในด้านความปลอดภัย และ ข้อมูลที่ Sensitive ตัว GPT-4 เทรนโดยยึดจุดนี้มากขึ้นมากๆ โดยเชิญ ผู้เชี่ยวชาญกว่า 50 สาขา เช่น cybersecurity, biorisk มาช่วยทดสอบ เพื่อป้องกันคนมา Request ข้อมูลที่ไม่ดี โดยรอบนี้สามารถลดการดึงข้อมูลที่ไม่พึงประสงค์ 82% เทียบกับ GPT-3.5
GPT-4 Developer Livestream
นอกจากการประกาศมาในเว็บแล้ว ยังมี Livestream Demo สดๆ ให้ดูด้วย โดยผู้ Demo ก็คือ Greg Brockman, President and Co-Founder of Open AI
โดยเค้ามีตัวอย่าง Demo ให้ดูหลายตัวเลย โดยผมจะเล่าถึง 3 อันที่ดูว้าวๆละกัน
ซึ่งเค้าจะมี Program Playground ที่เชื่อมต่อกับ GPT-4 อยู่ในการ Demo
#1 AI Assistant ช่วย Program
โดยเค้ากำหนด System ให้กับ AI ในการช่วยอ่านโค้ด แล้วก็คิด Step ต้องทำอะไรบ้างเป็นโค้ดแบบจำลอง (Pseudocode) แล้วสุดท้าย แปะโค้ดที่สามารถใช้ Run ได้จริงให้
โดยโจทย์เค้ากำหนดให้ทำ Discord Bot ที่รับ Input ทั้ง Text หรือ รูปภาพแล้วกำหนด Task ให้ Bot ทำตามจาก Input นั้น โดยใช้ข้อมูลจาก GPT-4
โดยเค้าได้บอกไว้เนื่องจาก Data Train มันจะสิ้นสุดช่วง 2021 แน่นอนว่า Discord API มันมีเปลี่ยนเรื่อยๆอยู่แล้ว ก็อาจจะพังได้ แล้วก็ตัว API อ่านรูปเพิ่งเพิ่มมาในปี 2022
ก็เลยจะมีการแปะ การทำ API อ่านรูปให้ Bot ไว้ด้วย เรียกว่า Cool อีกแล้ว นอกจากจะมีข้อมูลอดีตแล้ว ยังสามารถเรียนรู้สดๆ จาก Text ที่แปะไปให้
ซึ่งระหว่าง Demo ก็จะพบปัญหาหลายอย่าง จากที่กล่าวไปคือ API เปลี่ยน หรือว่า Syntax ไม่ถูกเนื่องจากใช้โปรแกรมรันไม่ถูกเวอร์ชั่น ซึ่งเค้าสามารถแปะ Error Code ไปเลย โดยตัว AI จะสามารถแก้ปัญหาได้เอง เช่นแก้ Code ให้ตรงเวอร์ชั่น
มีความเจ๋งอยู่ช่วงหนึ่งคือ Bot ไม่สามารถรับรูปได้ โดยคุณ Greg ได้ดูมาแล้วแหละว่า API มันต้องมีส่ง Parameter เพิ่ม ซึ่งเป็นของที่เพิ่มมาใน API ปีหลังๆ ซึ่งเป็นส่วนที่ AI ไม่รู้เนื่องจากไม่มีข้อมูล ซึ่งเค้าได้แก้ปัญหาโดยวิธีการสุดเจ๋ง ก็คือ Copy Document ทั้งก้อนแปะไปเลย
ผลปรากฏคือ AI สามารถแก้ปัญหาได้ตามที่คิดเลย โดยดูจาก Document ที่เราส่งให้แบบเละๆ
#2 ทดสอบพลัง Image Input กับการทำเว็บจากรูป
คุณ Greg ได้ลองเอารูป Mockup ที่เค้าทำในไว้ในสมุดเค้า เพื่อให้ AI ช่วยออกแบบเว็บให้ โดยถ่ายรูปสมุด และขอให้ AI ช่วยทำเว็บหน้าตาแบบในรูปที่ถ่ายมาให้ ซึ่งปรากฏว่าสามารถทำออกมาเป็นเว็บหน้าตาแบบนั้นได้จริงๆ จากดินสอเขียนร่างๆแบบรูป
#3 ทดสอบให้ทำ Task ยากๆที่ไม่ค่อยมีคนอยากทำ ก็คือทำ Tax Code
เนื่องจากผู้เขียนไม่ได้เป็นคนอเมริกา อาจจะยังไม่ค่อยเข้าใจเท่าไหร่ แต่เท่าที่ฟังคือเป็นการทำเรื่องภาษีแหละ โดยปกติแล้วเค้าจะต้องมานั่งอ่านเอกสารยาวเหยียดเกี่ยวกับ Tax Code ว่ามีเงื่อนไขอะไรบ้าง ต้องจ่ายอะไรยังไง
โดยคุณ Greg กำหนดให้ AI อ่าน Tax Code ทั้งหมด แล้วอธิบายให้เข้าใจง่ายทุก Detail ทุกขั้นตอนว่าต้องจ่ายอะไรยังไง ในระดับที่คนมาอ่านเพื่อยืนยันความถูกต้องได้
ก็เลยจัดไป คุณ Greg แปะไปเลย Tax Code 16 หน้าเต็มๆ !!
แน่นอนว่า AI สามารถสรุปออกมาอย่างง่ายๆ เป็นข้อๆเลย เป็นคำตอบพร้อมเหตุผล
คุณ Greg บอกว่าก่อนจะลองให้ทำโจทย์นี้ เค้าลองทำเองกว่าครึ่ง ชม. แล้วก็ยังไม่ได้
แม้แต่จุดที่ถ้าทำเองบางทีเค้ายังคิดไม่ถึงก็ยังแปะมาให้ครบพร้อมเหตุผลประกอบตาม System ที่เค้าตั้งไว้ว่าต้องมี Detail เป็น Step ง่ายๆ เพื่อให้คน Verify ได้
ปัจจุบัน GPT-4 ยังไม่ได้เปิดใช้เต็มที่ อีกทั้ง Feature Image Input ก็ยังพยายามปรับปรุงร่วมกับ Partner อยู่ เลยยังไม่ได้เอาออกมาให้ใช้สาธารณะ ณ วันนี้
แต่ถ้ามีผู้ที่สนใจอยากลอง GPT-4 แบบ Text สามารถไปลองใช้ผ่าน ChatGPT-Plus ได้สำหรับผู้ที่เสียเงินรายเดือน ซึ่งตอนนี้ยังเปิดทดลองให้ใช้แบบจำกัดจำนวนใช้อยู่ ส่วนผู้ใช้ฟรีต้องรอคอยไปก่อนอาจจะมีเปิดให้ในอนาคต
GPT ถูกเริ่มพัฒนามาตั้งแต่ 2018 แล้วออกมาเป็นแอพพลิเคชั่นที่ดังๆก็คือ ChatGPT ช่วงปลายปี 2022 รวมๆแล้วก็ประมาณ 5 ปี ถือว่าสั้นมาก โลกเปลี่ยนไวทุกวัน ถ้าเราไม่เตรียมพร้อม ก็อาจจะตามไม่ทันได้
Reference