OpenAI เปิดตัว Voice Engine หรือ AI ที่สามารถโคลนเสียงจากเสียงตัวอย่างได้

OpenAI เปิดตัวเครื่องมือ AI ใหม่ในรูปแบบ text-to-voice หรือเรียกว่า Voice Engine โดยอาศัยเสียงตัวอย่างที่มีความยาวอย่างน้อย 15 วินาที

ปัจจุบันการเข้าถึงการใช้งานสร้างเสียงจาก AI นั้น ยังถูกจำกัดเฉพาะกลุ่ม ได้แก่ บริษัทเทคโนโลยีการศึกษา-Age of Learning, แพลตฟอร์มการเล่าเรื่องด้วยภาพ-HeyGen, ผู้ผลิตซอฟต์แวร์ด้านสุขภาพ-Dimagi, ผู้สร้างแอปสื่อสาร AI Livox และระบบสุขภาพ-Lifespan

ทาง OpenAI ได้ลงตัวอย่างคลิปเสียงที่สร้างขึ้นโดย OpenAI โดยมีตัวอย่างเป็นคลิปเสียงต้นแบบ จากนั้น AI ก็สร้างเสียงขึ้นมาที่เหมือนกับต้นแบบเอามาก ๆ

คลิปเสียงต้นแบบ

เสียงที่สร้างขึ้นโดย AI

OpenAI บอกว่าบริษัทได้เริ่มพัฒนา Voice Engine ตั้งแต่ช่วงปลายปี 2022 ซึ่ง เจฟฟ์ แฮร์ริส (Jeff Harris) หนึ่งในทีมพัฒนาของ OpenAI เผยว่าเทคโนโลยีดังกล่าวผ่านการฝึกซ้อมกับข้อมูลที่เป็นสาธารณะและข้อมูลที่ได้รับอนุญาตแล้วเท่านั้น โดยโมเดลนี้จะอนุญาตให้นักพัฒนาราว 10 คนเท่านั้นที่สามารถเข้าถึงได้

การสร้างเสียงด้วยระบบ text-to-audio อยู่ในขอบเขตของ Generative AI ที่มีการพัฒนาอย่างต่อเนื่อง แม้ว่าบริษัทหรือนักพัฒนาส่วนใหญ่จะเน้นไปที่เสียงเครื่องดนตรีหรือเสียงที่เป็นธรรมชาติ แต่มีน้อยคนนักที่ให้ความสนใจเรื่องการสร้างเสียงขึ้นมา

OpenAI เปิดตัว Voice Engine หรือ AI ที่สามารถโคลนเสียงจากเสียงตัวอย่างได้

Honor จะเปิดตัว Power สมาร์ตโฟนระดับกลาง แบตฯ ใหญ่ 7,800 mAh ในวันที่ 15 เม.ย. นี้

iQOO เผยดีไซน์ Z10 Turbo สีส้มสวยสะดุดตา ฝาหลังลายเปลวไฟ พร้อมขุมพลัง Dimensity 8400

nubia เตรียมเปิดตัว RedMagic 10 Air ในวันที่ 16 เม.ย. นี้ พร้อมฮาร์ดแวร์ทรงพลังในบอดี้บางเฉียบ

vivo โชว์ดีไซน์เต็ม X200 Ultra : ยืนยันติดตั้งชิปเรือธง Snapdragon 8 Elite, กล้อง ZEISS คุณภาพสูง

Honor จะเปิดตัว Power สมาร์ตโฟนระดับกลาง แบตฯ ใหญ่ 7,800 mAh ในวันที่ 15 เม.ย. นี้

iQOO เผยดีไซน์ Z10 Turbo สีส้มสวยสะดุดตา ฝาหลังลายเปลวไฟ พร้อมขุมพลัง Dimensity 8400

nubia เตรียมเปิดตัว RedMagic 10 Air ในวันที่ 16 เม.ย. นี้ พร้อมฮาร์ดแวร์ทรงพลังในบอดีบางเฉียบ

vivo โชว์ดีไซน์เต็ม X200 Ultra : ยืนยันติดตั้งชิปเรือธง Snapdragon 8 Elite, กล้อง ZEISS คุณภาพสูง