Foxconn ออกมาเผยว่าได้ปล่อยโมเดลภาษาขนาดใหญ่ (LLM) โมเดลแรกในชื่อ FoxBrain และมีแผนจะใช้ในการพัฒนากระบวนการผลิตและการจัดการห่วงโซ่อุปทาน
บริษัทเผยว่า FoxBrain ถูกฝึกขึ้นมาด้วยการ์ดจอ H100 120 ตัวจนเสร็จสิ้นกระบวนการภายในเวลา 4 สัปดาห์ โมเดลดังกล่าวมีฐานการพัฒนามาจากสถาปัตยกรรม Llama 3.1 ของ Meta และมีความสามารถด้านการใช้เหตุผลในภาษาจีนแบบดั้งเดิมและภาษาจีนในสำเนียงแบบไต้หวัน
Foxconn ชี้ว่าแม้จะมีความแตกต่างในด้านศักยภาพระหว่าง FoxBrain และโมเดลของ DeepSeek แต่ศักยภาพโดยรวมก็ใกล้เคียงกับมาตรฐานระดับโลกอย่างมาก มีทั้งความสามารถในการวิเคราะห์ข้อมูล การสนับสนุนการตัดสินใจ การช่วยเหลือด้านเอกสาร คณิตศาสตร์ การใช้เหตุผลและการแก้ปัญหา และการสร้างโค้ด ทั้งนี้ เดิมทีแล้ว FoxBrain เป็นโมเดลที่ได้รับการออกแบบมาเพื่อใช้เป็นการภายใน
Foxconn ยังบอกด้วยว่าจะร่วมมือกับหุ้นส่วนในวงการเทคโนโลยีเพื่อขยายขอบเขตการนำ FoxBrain ไปใช้จริง รวมถึงแบ่งปันข้อมูลซอร์สโค้ด และส่งเสริมการใช้ AI ในการผลิต การบริหารห่วงโซ่อุปทาน และการตัดสินใจด้วย AI
NVIDIA ซึ่งถือเป็นหุ้นส่วนสำคัญของ Foxconn ได้สนับสนุนการพัฒนา FoxBrain ผ่านซูเปอร์คอมพิวเตอร์ Taipei-1 และให้คำปรึกษาด้านเทคนิคในช่วงการฝึกโมเดลด้วย