ผลการทดสอบ Hello World ด้วย Phi-3 ด้วย Ollama

Spec: Macbook Air M2, RAM 16GB SSD 512GB

Ponggun

Published in

T. T. Software Solution

4 min readJun 24, 2024

เกริ่นนำ

บทความนี้เป็นผลของการทดลองทำตามเนื้อหาใน Video ของอาจารย์
Surasuk Oakkharaamonphong มากๆครับ

ท่านใดสนใจติดตามได้ที่ Video นี้เลยครับผม

Phi-3 คืออะไร

คือโมเดลปัญญาประดิษฐ์แบบภาษาขนาดเล็ก (Small Language Model หรือ SLM) ที่พัฒนาโดย Microsoft Research โมเดลนี้ถูกออกแบบมาให้มีประสิทธิภาพสูงและคุ้มค่า โดยมีขนาดเพียง 3.8 พันล้านพารามิเตอร์ ซึ่งน้อยกว่าโมเดลภาษาขนาดใหญ่ แต่ยังสามารถทำงานได้ดีในหลายด้าน เช่น การเข้าใจภาษา การเขียนโค้ด และการทำโจทย์คณิตศาสตร์ที่ไม่ซับซ้อนมาก

Phi-3 Mini — มีขนาด 3.8 พันล้านพารามิเตอร์ (3B)
Phi-3 Medium — มีขนาด 14 พันล้านพารามิเตอร์ (14B)

Phi-3 ได้รับการพัฒนาให้สามารถใช้งานได้ง่ายและเข้าถึงได้มากขึ้นปัจจุบัน นักพัฒนาสามารถเข้าถึง Phi-3 ได้บนแพลตฟอร์ม Azure, Hugging Face และ Ollama

License MIT ใช้ได้สบายเยย

GitHub - microsoft/Phi-3CookBook: This is a Phi-3 book for getting started with Phi-3. Phi-3, a…

This is a Phi-3 book for getting started with Phi-3. Phi-3, a family of open AI models developed by Microsoft. Phi-3…

github.com

phi3

Phi-3 is a family of lightweight 3B (Mini) and 14B (Medium) state-of-the-art open models by Microsoft.

ollama.com

ศึกษาเนื้อหาเพิ่มเติมได้ที่บทความของคุณ Boat Charunthon นะครับ สรุปไว้ดีงามมากๆๆๆ

Cracking Down inside Phi-3: รักแรกพบจนอยาก “เทรน” เธอ ❤️

เจาะลึกโมเดล SLM ตัวใหม่ล่าสุดจากทาง Microsoft พร้อมกับการสร้าง Chatbot กับ Ollama และ Streamlit

medium.com

Ollama

เป็นซอฟต์แวร์สำหรับรันโมเดลปัญญาประดิษฐ์ในกลุ่ม LLM บนเครื่องไคลเอนต์ซึ่งช่วยประหยัดค่าใช้จ่ายได้มากเลยครับ

ปล.การใช้ GPU หรือ NPU ในการรันโมเดลภาษา (LLM) เช่น Ollama จะทำให้ประสิทธิภาพในการประมวลผลดีขึ้นมากเมื่อเทียบกับการใช้ CPU ทำให้การรันงานรวดเร็วและมีประสิทธิภาพมากขึ้น

Ollama

Get up and running with large language models.

ollama.com

ศึกษาการใช้งานได้ที่นี้นะครับ

ollama/docs/api.md at main · ollama/ollama

Get up and running with Llama 3, Mistral, Gemma, and other large language models. - ollama/docs/api.md at main ·…

github.com

การติดตั้งโปรแกรม Ollama

ทำได้สองวิธีนะครับ

#1: Docker: Link

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

#2: Download และ Install ผ่านหน้าเว็ปได้เลย: Link

เสร็จแล้วลองรัน

ollama run phi3

ผมขอสรุปผลเลยนะครับ ฮา น้ำตาจิไหล T___T

ผลการรัน

❌ รันผ่าน Docker — น้อนไม่ตอบสนอง
✅ รันผ่าน Ollama App — รอรับคำสั่งสวยๆ

การใช้ทรัพยากร

❌ รันผ่าน Docker — CPU 600% 😂 (ผม Setup GPU ใน Docker บน M2 ไม่ได้นะครับ)
✅ รันผ่าน Ollama App — เบาๆ 😎

การตอบสนองต่อคำสั่ง

❌ ภาษาไทย — มุแง้ 😭 (ก็ตามที่ระบุใน Doc เลยครับ ผมดื้อเอง ฮะๆ)
✅ ภาษาอังกฤษ — หล่อ… 🤟

เขาก็เตือนแล้ว ไอ้เราก็ดื้อเอง ฮาๆ ollama.com/phi3

สิ่งที่จะลองทำต่อไป

ศึกษา Document 😎 เพื่อดูการนำ Ollama ไปใช้งานบน Azure VM เพื่อทดลองการ Hosting SLM ด้วยตัวเอง
หา Azure VM ที่มี GPU สักตัว
เขียน ASP.NET มาอันนึง แล้วลอง Call API ไปที่ VM ดู
ทำ CI/CD
จำลอง Local Dev + Dev Server

แถมความล้มเหลวที่ Setup Docker ไม่สำเร็จครับ

มาดูกันว่าผมติดตรงไหนบ้าง

เริ่มจากเข้าไปที่ Docker Hub กันก่อนเบย

ลองรันคำสั่งเพื่อทดลองใช้

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

Port: 11434 = 1(L) 1(L) 4(A) 3(M) 4(A) = llama

ติดตั้ง VS Code Docker Extension เพื่อให้เรา Shell เข้าไปจัดการกับ Docker สะดวกๆครับโผม เพราะเราสามารถดูโครงสร้างหรือแก้ไข Files ได้สะดวกมากๆผ่าน VS Code ครับ