สำนักข่าว The Information รายงานโดยอ้างแหล่งข่าวคนวงในว่า Google กำลังพัฒนาเทคโนโลยี AI ที่สามารถเข้ามาควบคุมคอมพิวเตอร์ผ่านเว็บเบราว์เซอร์ของผู้ใช้เพื่อช่วยทำงานต่าง ๆ เช่น การสืบค้นข้อมูล การจับจ่ายซื้อของ หรือจองเที่ยวบิน ซึ่งเป็นผลิตภัณฑ์ภายใต้ชื่อรหัส ‘Project Jarvis’ ที่ขับเคลื่อนโดย Gemini โมเดลภาษาขนาดใหญ่ (LLM) รุ่นถัดไป และจะมีการเปิดตัวพร้อมสาธิตการใช้งานในเดือนธันวาคมนี้
Jarvis เป็นผลิตภัณฑ์ที่อาจจะถูกบรรจุอยู่ในเบราว์เซอร์ Google Chrome ซึ่งสามารถช่วยให้ผู้ใช้ทำงานบนเว็บได้อัตโนมัติ โดยเบื้องหลัง AI จะจับภาพบนหน้าจอเพื่อดูการทำงานบนเว็บเบราว์เซอร์ในตอนนั้น แล้วตีความเนื้อหาและบริบทว่ากำลังทำงา่นเกี่ยวกับอะไร จากนั้นก็จะช่วยทำงานแทนผู้ใช้ เช่น ป้อนข้อความอัตโนมัติหรือการคลิกปุ่ม ทั้งนี้แหล่งข่าวอ้างว่าต้นแบบของผลิตภัณฑ์ตัวปัจจุบันใช้เวลาในการทำงานตามขั้นตอนทั้งหมดเพียงไม่กี่วินาทีเท่านั้น
เดือนกรกฎาคมที่ผ่านมา มีรายงานว่า OpenAI กำลังพัฒนาโมเดล AI ใหม่ภายใต้ชื่อรหัส ‘Strawberry’ ที่มีความสามารถในการใช้เหตุผล และสามารถทำการวิจัยด้วยการเปิดดูเว็บสืบค้นข้อมูลได้อัตโนมัติผ่านความช่วยเหลือของ CUA (Computer-using agent หรือซอฟต์แวร์เอไอที่ช่วยในการควบคุมคอมพิวเตอร์ให้ทำงานแทนผู้ใช้) จากนั้นก็จะทำงานตามข้อมูลผลลัพธ์ที่สืบค้นได้
Jarvis มีความคล้ายคลึงกับโมเดล Claude ของ Anthropic ที่พึ่งเปิดตัวไปเมื่อสัปดาห์ที่ผ่านมา ซึ่งโมเดล Claude มีความสามารถในการควบคุมคอมพิวเตอร์ให้ทำงานต่าง ๆ แทนผู้ใช้ได้อัตโนมัติ เช่น สืบค้นข้อมูลบนเว็บ เปิดแอปพลิเคชัน และป้อนข้อความโดยใช้เมาส์และคีย์บอร์ด