Amazon ประกาศเปิดตัว Nova Act ระบบ AI Agent ใหม่ล่าสุดที่สามารถควบคุมเว็บเบราว์เซอร์และทำงานพื้นฐานบนอินเทอร์เน็ตได้ด้วยตัวเอง เช่น การสั่งอาหาร หรือจองร้านอาหาร

โดยเปิดให้นักพัฒนาสามารถดาวน์โหลดชุดเครื่องมือ SDK เพื่อทดลองสร้างต้นแบบได้ทันที ซึ่งถือเป็นการเข้าสู่สนามแข่งขัน AI Agent เต็มตัว ชนกับ OpenAI และ Claude ที่ออกระบบมาก่อนหน้านี้แล้ว

Nova Act ถูกพัฒนาโดยศูนย์วิจัย AGI แห่งใหม่ของ Amazon ในซานฟรานซิสโก นำโดยอดีตทีมงานจาก OpenAI อย่าง เดวิด ลวน (David Luan) และ ปีเตอร์ แอ็บบีล (Pieter Abbeel) โดยระบบนี้จะถูกนำไปต่อยอดใช้งานจริงใน ‘Alexa+’ รุ่นอัปเกรดใหม่ที่จะเปิดตัวเร็ว ๆ นี้ด้วย แต่รุ่นที่เปิดตัววันนี้ยังอยู่ในสถานะทดลองใช้เท่านั้น

นักพัฒนาโปรแกรมหรือแอปฯ สามารถเข้าถึง Nova Act ผ่านเว็บไซต์ nova.amazon.com ซึ่งรวบรวมโมเดลพื้นฐานต่าง ๆ ในตระกูล Nova ของ Amazon ไว้ด้วยกัน โดยระบบนี้ถูกออกแบบมาเพื่อให้ AI สามารถเข้าใจหน้าเว็บ กรอกข้อมูลในแบบฟอร์ม หรือเลือกวันที่ในปฏิทินได้อัตโนมัติ ซึ่ง Amazon คาดว่าจะช่วยให้นักพัฒนาสร้างแอปพลิเคชัน AI ที่มีประสิทธิภาพมากขึ้น

Amazon อ้างว่า Nova Act มีประสิทธิภาพสูงกว่า AI Agent คู่แข่งอย่าง OpenAI Operator และ Claude 3.7 Sonnet ของ Anthropic จากผลทดสอบภายในบริษัท โดยเฉพาะการทดสอบ ScreenSpot Web Text ที่ Nova Act ทำคะแนนได้ 94% สูงกว่า OpenAI (88%) และ Anthropic (90%)

อย่างไรก็ตาม Amazon ยังไม่ได้เปิดเผยผลการทดสอบจากมาตรฐานที่นิยมอย่าง WebVoyager ซึ่งยังต้องรอดูผลในอนาคตว่าจะทำได้ดีแค่ไหนในสถานการณ์จริง

เดวิด ลวน ผู้ร่วมก่อตั้งศูนย์วิจัย AGI ของ Amazon เผยว่า แม้ AI Agent ในตอนนี้จะยังมีความสามารถจำกัด แต่เป็นก้าวสำคัญที่จะนำไปสู่เป้าหมายสุดท้ายอย่าง AGI หรือ AI ที่สามารถทำได้ทุกอย่างเหมือนมนุษย์ โดยเขายังเน้นย้ำว่าเป้าหมายหลักคือการสร้าง AI ที่ช่วยให้ชีวิตมนุษย์ง่ายขึ้น แม้จะไม่ใช่ระบบอัตโนมัติเต็มรูปแบบก็ตาม