Microsoft ปล่อย Phi-3 Mini โมเดล AI ตัวจิ๋วที่ประมวลผลเทียบเคียงรุ่นใหญ่

Microsoft ปล่อยตัว Phi-3 Mini โมเดล AI ขนาดเบารุ่นใหม่ และจะเป็นโมเดล AI ขนาดเล็กตัวแรกใน 3 โมเดลที่มีแผนจะปล่อยในอนาคต

Phi-3 Mini มีขนาดคำสั่งที่สามารถประมวลผลได้อยู่ที่ 3,800 ล้าน พารามิเตอร์ และฝึกกับชุดข้อมูลที่มีขนาดเล็ก เมื่อเทียบกับโมเดลภาษาใหญ่ ๆ (LLMs) อย่าง GPT-4

โดยบริษัทปล่อย Phi-3 Mini ให้บริการบน Azure, Hugging Face และ Ollama นอกจากตัวนี้แล้ว Microsoft จะปล่อย Phi-3 Small ไซซ์ 7,000 ล้านพารามิเตอร์ และ Phi-3 Medium ขนาด 14,000 ล้านพารามิเตอร์ตามมา

Microsoft ปล่อยตัว Phi รุ่นที่แล้วเมื่อเดือนธันวาคม ซึ่งมีความสามารถเทียบเคียงได้กับโมเดลที่มีขนาดใหญ่กว่าอย่าง Llama 2 ได้ด้วย

บริษัทชี้ว่า Phi-3 ทำงานได้ดีกว่ารุ่นก่อนหน้าและจะสามารถตอบสนองได้ใกล้เคียงกับโมเดลที่มีขนาดใหญ่กว่าตัวมันเอง 10 เท่าได้

เอริก บอยด์ (Eric Boyd) รองประธานองค์กรของ Microsoft Azure AI Platform เผยว่า Phi-3 Mini มีความสามารถพอ ๆ กับ GPT-3.5 แต่ในฟอร์มแฟกเตอร์ (ขนาด) ที่เล็กว่า

บอยด์กล่าวด้วยว่าการฝึก Phi-3 ทำโดยการสร้าง ‘ตารางเรียน’ ที่ได้รับแรงบันดาลใจมาจากวิธีการที่เด็กเรียนจากนิทานก่อนนอน หนังสือที่ใช้คำง่าย ๆ และรูปประโยคที่พูดเกี่ยวกับหัวข้อใหญ่ ๆ

เขาชี้ว่าในตลาดไม่ได้มีหนังสือเด็กมากนัก ทางทีมงานเลยสร้างรายชื่อคำศัพท์มากกว่า 3,000 คำ และขอให้ LLM นำไปสร้างหนังสือเด็กเพื่อสอน Phi

บอยด์บอกว่าบริษัทต่าง ๆ มักจะพบว่าโมเดลเล็ก ๆ เหมาะกับใช้งานมากกว่า เพราะว่าชุดข้อมูลที่แต่ละบริษัทมีส่วนใหญ่มักจะมีขนาดเล็ก อีกทั้งโมเดลเหล่านี้ใช้ทรัพยากรในการประมวลผลน้อยกว่า และมีราคาถูกกว่ามากด้วย