OpenAI บริษัท ที่ร่วมก่อตั้งโดย Elon Musk และได้รับการสนับสนุนจาก Microsoft เปิดตัว DALL-E โปรแกรม AI ที่พัฒนาจาก GPT-3 ซึ่งสามารถสร้างสรรค์รูปภาพ จากคำอธิบายรายละเอียดของภาพได้
Dell-E สามารถสร้างภาพตามคำบอกได้ ตัวอย่างเช่น ถ้าเราต้องการรูปภาพแมวที่ทำจากซูชิ หรือแม้แต่ภาพรวมของยีราฟ เต่า และตัวไคเมร่า โปรแกรมก็จะสร้างสรรค์มาให้ นอกจากนี้ตัวโปรแกรมยังสามารถวาดภาพรวมสิ่งที่เราต้องการเข้าด้วยกัน ในมุมมองที่แตกต่างกัน รวมถึงการตัดภาพแบบ Cutaway และมุมมองภายในอีกด้วย
AI ตัวนี้แตกต่างจากโปรแกรมเปลี่ยนข้อความเป็นรูปภาพ (text-to-image programs) ตรงที่ AI สามารถใส่รายละเอียดเล็ก ๆ น้อย ๆ ของสิ่งที่เราต้องการเพื่อให้ได้ภาพที่สมจริงมากยิ่งขึ้น ตัวอย่างเช่น เราต้องการภาพเหมือนจริงของสุนัขจิ้งจอกนั่งในทุ่งหญ้าช่วงฤดูหนาว Dell-E จะกำหนดเงาขึ้นมาเพื่อให้ภาพสมบูรณ์ขึ้นโดยที่เราไม่ต้องระบุรายละเอียดลงไป และจุดนี้เองทำให้ Dell-E ต่างจากโปรแกรม 3D rendering engine ที่จำเป็นต้องระบุรายละเอียดอย่างชัดเจนด้วยเช่นกัน
นอกจากนี้ OpenAI ยังได้ประโยชน์จากอีกหนึ่งความสามารถที่เรียกว่า Zero-shot reasoning ความสามารถนี้ทำให้ AI สามารถผลิตผลลัพธ์ตามคำอธิบายได้โดยที่ไม่ต้องฝึกสอน ทำให้ AI สามารถแปลงาน และทำงานอื่น ๆ ได้ ด้วยความสามารถนี้ทำให้นักวิจัยสามารถประยุกต์ใช้โปรแกรมเพื่อแปลงภาพเป็นภาพ และข้อความเป็นภาพได้ ยกตัวอย่างเช่น มันสามารถสร้างภาพแมวจากภาพร่างพร้อมกับคำอธิบายว่า ‘แมวตัวเดียวกันที่เหมือนกับภาพล่างด้านล่าง’
ระบบมีความสามารถอื่น ๆ อีกมากมาย เช่นการทำความเข้าใจว่าโทรศัพท์และวัตถุอื่น ๆ เปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป เข้าใจข้อเท็จจริงทางภูมิศาสตร์ สถานที่สำคัญ และสร้างภาพในรูปแบบภาพถ่าย ภาพประกอบ หรือแม้แต่ภาพตัดปะ
ตอนนี้ Dell-E ยังจำกัดการใช้อยู่ จากที่กล่าวมาข้างต้นดูเหมือนว่าระบบจะทำงานได้ดีจนน่าตกใจ แต่เปล่าเลยมันก็ยังเป็น AI อยู่วันยังค่ำ เพราะบางทีเราก็ได้ภาพที่ดูไม่ได้เรื่อง และแปลกประหลาดจากคำอธิบายของเราเช่นกัน ถึงอย่างนั้นนักวิจัยก็ยังไม่เข้าใจระบบการทำงานในการประมวลผลภาพขึ้นมาชัดๆ เนื่องด้วย Black box ของระบบ
ในอนาคต Dell-E อาจกลายเป็นต้นแบบโปรแกรมเพื่อช่วยในการวิเคราะห์ข้อมูลต่าง ๆ เช่น ผลกระทบทางเศรษฐกิจต่อกระบวนการทำงานและวิชาชีพ หรือประเด็นทางสังคมอื่น ๆ เป็นต้น
อ้างอิง Engadget
พิสูจน์อักษร : สุชยา เกษจำรัส