วันจันทร์ที่ 28 ตุลาคม xAI บริษัทสตาร์ตอัปด้าน AI ที่ก่อตั้งโดย อีลอน มัสก์ โพสต์บนแพลตฟอร์ม X (Twitter) ว่าบริษัทได้เพิ่มความสามารถการทำความเข้าใจภาพลงไปในโมเดล Grok AI และพร้อมใช้งานแล้ว ซึ่งช่วยให้สมาชิก X Premium และ Premium+ สามารถอัปโหลดภาพแล้วสอบถาม AI เกี่ยวกับเนื้อหาที่อยู่ภายในภาพนั้นได้

นอกจากนี้ มัสก์ได้โพสต์บน X เกี่ยวกับ Grok ว่าตอนนี้สามารถทำความเข้าใจรูปภาพได้แล้ว แถมยังอธิบายความหมายของภาพมุกตลกได้อีกด้วย (มีตัวอย่างให้ดูด้วย) ซึ่งนี่ก็เป็นแค่เวอร์ชันเริ่มต้นเท่านั้น และจะปรับปรุงให้ดียิ่งขึ้นอย่างรวดเร็ว

ปลายเดือนมีนาคม xAI ได้เปิดตัว Grok-1.5 ว่าจะมาพร้อมด้วยความสามารถในการให้เหตุผล และรองรับความยาวของข้อความที่แชตบอตสามารถประมวลผลได้ (context length) ที่ 128,000 โทเค็น ต่อมาเดือนเมษายนก็ได้แสดงตัวอย่างความสามารถของ Grok-1.5 ที่มีความสามารถในการประมวลผลรูปภาพได้อย่างหลากหลาย ได้แก่ เอกสาร ไดอะแกรม แผนภูมิ ภาพหน้าจอ และภาพถ่าย

ต่อมาปลายเดือนสิงหาคม xAI ได้เปิดตัวโมเดล AI ใหม่ Grok-2 และ Grok-2 mini รุ่นเบตา ที่มาพร้อมด้วยฟีเจอร์การสร้างรูปภาพ แต่พบว่าไม่มีการป้องกันหรือจำกัดขอบเขตที่เหมาะสม โดยเบื้องหลังเป็นการใช้โมเดล FLUX.1 ที่พัฒนาโดย Black Forest Labs เปิดให้งานเฉพาะนักพัฒนาและสมาชิก X ระดับ Premium ทั้งนี้ xAI เผยว่าการเปิดตัวในอนาคตจะเพิ่มทำความเข้าใจในหลากหลายรูปแบบ (หมายถึงทั้งข้อความ รูปภาพ คำอธิบายภาพ วิดีโอ และเสียง) ให้กับ Grok ทั้งบน X และโมเดลบน API สำหรับนักพัฒนา

บนโพสต์ของมัสก์ได้มีคอมเมนต์หนึ่งวิจารณ์ว่า Grok ไม่สามารถจัดการรูปภาพหรือ PDF ได้ ซึ่งยังตามหลัง ChatGPT อยู่มาก ซึ่งมัสก์ก็ได้ตอบว่าคงอีกไม่นานหรอก และจะทำเสร็จภายในไมกี่เดือน ซึ่งคนอื่นใช้เวลาทำเป็นปี และมีคำวิจารณ์ตอกย้ำว่า แม้ Grok จะใช้เวลาทำไม่กี่เดือน แต่ ChatGPT ก็พัฒนาต่อไปอีกขั้นด้วยฟีเจอร์ใหม่ ๆ แต่ก็มีบางคนชมว่า Grok สามารถวิเคราะห์รูปภาพได้ดี รวมทั้งตอบคำถามทางคณิตศาสตร์หรือจิตวิทยาได้ใกล้เคียงกับความคิดของมนุษย์มาก

นอกจากนี้ X ได้พยายามเพิ่มฟีเจอร์ใหม่ ๆ ให้กับสมาชิกระดับ Premium ซึ่งล่าสุดเมื่อช่วงต้นเดือนนี้ X ได้เปิดตัวเครื่องมือวิเคราะห์แนวโน้มที่มีชื่อว่า Radar เพื่อช่วยวิเคราะห์ข้อมูลเชิงลึกที่เกี่ยวกับแนวโน้มและบทสนทนาบนแพลตฟอร์มในแบบเรียลไทม์ให้กับสมาชิก Premium+ ซึ่งช่วยให้นักการตลาดสามารถเข้าใจแนวโน้มเพื่อนำไปวางแผนการโพสต์บน X ให้เข้าถึงกลุ่มเป้าหมายได้ดีขึ้น