เรียกได้ความเป็นส่วนตัวและลิขสิทธิ์ของเนื้อหาถูกนำไปเทรน AI เป็นเรื่องที่ถกเถียงกันไม่สิ้น ล่าสุดมีรายงานได้บอกว่า Apple, Nvidia และ Anthropic ใช้ Subtitle วิดีโอ YouTube มาเทรน AI

โดยรายงานนี้ถูกรายงานโดย Proof และสำนักข่าว Wired ที่ได้บอกว่า บริษัทเทคโนโลยีระดับโลกอย่าง Apple, Nvidia, Anthropic และ Saleforce ใช้ข้อมูล Subtitle วิดีโอของ YouTube ไปใช้เทรน AI ของตัวเองโดยไม่ได้รับอนุญาต ซึ่งข้อมูลซับไตเติลเหล่านี้ก็ได้มาจากวิดีโอมากกว่า 170,000 วิดีโอ จากช่องมากกว่า 48,000 ช่อง

ซึ่งช่องที่ถูกโดนดึงข้อมูลซับไตเติลในครั้งนี้ก็มีแต่ช่องดัง ๆ เช่น MIT, Harvard, The Wall Street Journal, MKBHD ของ มาร์เควส บราวน์ลี (Marques Brownlee), MrBeast, PewDiePie, รายการ Last Week Tonight ของ จอห์น โอลิเวอร์ (John Oliver) และ Jimmy Kimmel Live

ทาง Proof ก็ได้ทำการสืบสวนพบว่า องค์กรไม่แสวงหาผลกำไรที่ดึงข้อมูลซับไตเติล YouTube ในครั้งนี้มีชื่อว่า ‘EleutherAI’ ซึ่งองค์กรนี้ก็มีงานวิจัยตัวหนึ่งที่จัดทำเกี่ยวกับ Dataset ที่มีชื่อว่า ‘The Pile’ เป็นชุดข้อมูลที่เปิดกว้าง และใครก็สามารถใช้ข้อมูลนำไปพัฒนา และศึกษา AI ได้ อีกทั้งทาง Proof พบว่า Apple ก็ได้ใช้ชุดข้อมูล ‘The Pile’ ไปใช้เทรนโมเดล AI ของตัวเองอีกด้วย

ซึ่งทางมาร์เควส บราวน์ลี (Marques Brownlee) ก็ได้ออกมาโต้ตอบบน X ส่วนตัวว่า “การกระทำดังกล่าวของ Apple เป็นเพียงแค่การหลีกเลี่ยงกระทำความผิดด้วยเงื้อมมือของตัวเอง”

แต่อย่างไรก็ตามในตอนนี้ Apple ก็ยังไม่ได้ออกมาตอบโต้ประเด็นนี้แต่อย่างใด เพราะการใช้ข้อมูลจาก YouTube โดยไม่ได้รับอนุญาตก็เป็นเรื่องที่ผิดกฎอย่างแน่นอน แม้ว่าจะใช้ Dataset ที่ถูกจัดเก็บโดยผู้อื่นก็ตาม