วันอังคารที่ 25 มิถุนายน OpenAI ประกาศว่าจะเลื่อนการเปิดตัวฟีเจอร์ Voice Mode ออกไปเป็นเดือนกรกฎาคม เนื่องจากติดปัญหาทางเทคนิค ซึ่งก่อนหน้านี้บริษัทได้วางแผนไว้ว่าจะเปิดตัวฟีเจอร์การสนทนาด้วยเสียงในเวอร์ชันอัลฟ่า ให้แก่ผู้ใช้ ChatGPT Plus กลุ่มเล็ก ๆ ในช่วงปลายเดือนมิถุนายน แต่ตอนนี้ต้องขอเวลาเพิ่มอีก 1 เดือน เพื่อให้ฟีเจอร์ทำงานได้ตามมาตรฐานสำหรับการเปิดตัว

OpenAI บอกว่าสิ่งที่กำลังปรับปรุง ได้แก่ ความสามารถของโมเดลในการตรวจจับและปฏิเสธเนื้อหาบางอย่าง ประสบการณ์สำหรับผู้ใช้ และเตรียมโครงสร้างพื้นฐานให้ขยายขนาดบริการที่ใหญ่ขึ้นในขณะที่ยังคงรักษาการตอบสนองแบบเรียลไทม์ สรุปง่าย ๆ ว่าขยายให้รองรับผู้ใช้และบริการที่เพิ่มขึ้นได้อย่างราบรื่น

OpenAI จะเริ่มเปิดให้ใช้ฟีเจอร์ดังกล่าวในรุ่นอัลฟ่า (ฟีเจอร์ที่พึ่งเขียนโปรแกรมเสร็จใหม่ ๆ เปิดทดลองใช้กับสมาชิกหรือลูกค้าประจำ) กับผู้ใช้กลุ่มเล็ก ๆ เพื่อรวบรวมคำติชม และจะขยายสู่ผู้ใช้ ChatGPT Plus ทุกคนในช่วงฤดูใบไม้ร่วง (สิงหาคม – ธันวาคม) แต่ก็ขึ้นอยู่กับการตรวจสอบความปลอดภัยและความน่าเชื่อถือระดับสูงของบริษัท

นอกจากนี้ OpenAI ยังกำลังทำงานเกี่ยวกับการเปิดตัวความสามารถใหม่ในการแชร์วิดีโอและหน้าจอ ซึ่งจะทดลองการใช้งานแยกกัน และจะแจ้งกำหนดเวลาให้ทราบต่อไป

เดือนพฤษภาคม OpenAI เผยว่าจะเปิดตัวโมเดลเอไอรุ่นใหม่ คือ GPT-4o ที่มีความสามารถสนทนาด้วยเสียง คือ รับคำสั่งเสียงจากผู้ใช้และ ChatGPT ก็จะตอบกลับด้วยเสียง ซึ่งเหมือนกับคนกำลังพูดคุยโต้ตอบกันอย่างสมจริงและดูเป็นธรรมชาติ รวมทั้งสามารถโต้ตอบกับข้อความและรูปภาพ คือ ผู้ใช้สามารถป้อนคำถามด้วยรูปภาพและข้อความใส่มาพร้อมกัน ก็สามารถเข้าใจแล้วตอบกลับได้