อีลอน มัสก์ (Elon Musk) และทีมงาน xAI ได้นำชิปจีพียู (หน่วยประมวลผลกราฟิก) H200 ซึ่งใช้สถาปัตยกรรม Blackwell รวม 100,000 ตัว มาสร้างซูเปอร์คลัสเตอร์ ‘Colossus’ ได้ภายใน 19 วัน ทำเอา เจนเซน หวง (Jensen Huang) ซีอีโอของ NVIDIA กล่าวชื่นชมในผลงานอันน่าทึ่งนี้
ในช่วงเวลาเพียง 19 วันนี้ ไม่ได้เสร็จแค่การออกแบบ การสร้าง แต่ยังมีการทดสอบความเข้ากันได้ อย่างการลองทดสอบการฝึก AI ด้วยซูเปอร์คลัสเตอร์นี้จนเสร็จสิ้นด้วย
ขั้นตอนในการสร้างซูเปอร์คลัสเตอร์มีตั้งแต่การสร้างโรงงาน X ขนาดมหึมาเพื่อให้ใส่จีพียูทั้งหมดเข้าไปได้ การติดตั้งระบบทำความเย็นด้วยของเหลว (liquid cooling) และติดตั้งระบบพลังงาน เพื่อให้จีพียูทุกตัวทำงานได้อย่างไร้ที่ติ นี่ยังไม่รวมการที่ทีมวิศวกรของ NVIDIA และ xAI ต้องขนฮาร์ดแวร์และโครงสร้างอาคารทั้งหมดเข้ามาติดตั้งอย่างแม่นยำและตรงตามที่ได้วางแผนไว้
หวงชี้ว่าปกติแล้วงานระดับนี้ต้องใช้เวลาโดยเฉลี่ยถึง 4 ปี วางแผนอย่างเดียวก็ 3 ปีแล้ว อีก 1 ปีคือเวลาที่ใช้ในการขนอุปกรณ์ ติดตั้ง และเปิดใช้งาน แต่มัสก์และทีมงานจาก xAI สามารถทำได้โดยใช้เวลาเพียงแค่ไม่ถึง 3 สัปดาห์ แถมการผสาน H200 ถึง 100,000 ตัวเข้าด้วยกันยังเป็นสิ่งที่ไม่เคยมีมาก่อนอีกด้วย และเชื่อว่ายังไม่น่ามีบริษัทไหนที่ทำได้อีกในเร็ว ๆ นี้
หวงยังบอกอีกว่าระบบโครงข่ายฮาร์ดแวร์ของ NVIDIA ที่ใช้ติดตั้งทั้งหมดนั้นซับซ้อนมาก การเชื่อมโครงข่ายเข้าหากันไม่เหมือนกับเซิร์ฟเวอร์ฐานข้อมูลทั่ว ๆ ไป สายไฟที่เชื่อมโยงระหว่างโหนดและคอมพิวเตอร์มีมหาศาล