เจฟฟ์ ดีน (Jeff Dean) หัวหน้านักวิทยาศาสตร์ของ Google DeepMind ได้โพสต์บน X แนะนำ Gemini 2.0 Flash Thinking โมเดลการใช้เหตุผลในขั้นทดลอง ซึ่งสามารถตอบคำถามที่ซับซ้อนโดยแสดงความคิดตัดสินใจออกมาได้อย่างถูกต้องชัดเจน ทั้งนี้คาดว่ามีเป้าหมายจะออกมาเพื่อแข่งขันกับ o1 โมเดลการใช้เหตุผลของ OpenAI

Gemini 2.0 Flash Thinking ถูกสร้างและอยู่บนความเร็วพร้อมประสิทธิภาพของโมเดล Gemini 2.0 Flash รวมทั้งได้รับการฝึกให้ใช้ความคิดเพื่อเสริมสร้างความสามารถในการใช้เหตุผล ซึ่งผลลัพธ์ที่ออกมามีแนวโน้มที่ดี โดยดีนได้แสดงตัวอย่างการทดลองใช้งานจริงของโมเดล Gemini 2.0 Flash Thinking ในการแก้ปัญหาฟิสิกส์เกี่ยวกับโฟตอนและอิเล็กตรอน พร้อมได้อธิบายการใช้เหตุผลในการหาคำตอบมาให้ชมด้วย ซึ่งการใช้เหตุผลของเอไอจะแตกต่างจากที่มนุษย์ทำ โดยการแบ่งคำสั่งออกเป็นงานย่อย ๆ ซึ่งสามารถสร้างผลลัพธ์ที่ดีกว่า

นอกจากนี้ ยังมีตัวอย่างการแก้ปัญหาที่มีองค์ประกอบทั้งภาพและข้อความด้วยโมเดลการใช้เหตุผล ซึ่งโพสต์โดย โลแกน คิลแพทริก (Logan Kilpatrick) หัวหน้าผลิตภัณฑ์ของ Google ได้โพสต์รูปภาพบิลเลียดที่มีตัวเลข 4 หมายเลขและได้พิมพ์คำถามว่าใช้ 3 ตัวเลขรวมกันแล้วได้เป็น 30 อย่างไร ซึ่งแสดงการหาคำตอบและมีคำตอบที่ถูกต้อง เขาได้กล่าวเพิ่มเติมว่านี่เป็นเพียงขั้นแรกของโมเดลการใช้เหตุผล และเชิญชวนให้ผู้ใช้เข้าไปทดลองได้ที่ AI Studio

เมื่อช่วงต้นเดือน Google ได้ปล่อย Gemini 2.0 โมเดล AI ใหม่ ที่สามารถทำได้ทั้งสร้างภาพและเสียงได้ ซึ่งอ้างว่าเป็น AI รุ่นใหม่สำหรับการเป็นเอเจนต์หรือตัวแทนที่สามารถทำงานแทนมนุษย์ได้ นอกจากนี้ทางคู่แข่งอย่าง OpenAI ก็ได้ปล่อย o1 โมเดลการใช้เหตุผลเวอร์ชันเต็มออกมาด้วยและเปิดให้ใช้งานสำหรับผู้ใช้แพ็กเกจ ChatGPT Pro