หลายคนที่ติดตามข่าวคราวของวงการไอทีคงจะได้ยินชื่อ Blackwell สถาปัตยกรรมชิปประมวลผล AI จากค่าย NVIDIA ที่เปิดตัวยิ่งใหญ่อลังการจนขายหมดไปยัน 12 เดือนข้างหน้า

แล้วอะไรคือ Blackwell และทำไมมันถึงมาแรงแซงเจ้าอื่นไปได้ขนาดนี้ ?

อะไรคือ Blackwell ?

Blackwell ที่จริงแล้วเป็นชื่อของสถาปัตยกรรมขนาดเล็ก (Microarchitecture) ที่เป็นแพลตฟอร์มสำหรับการผลิตชิปประมวลผลกราฟิก (GPU) ที่สามารถนำไปต่อยอดผลิตเป็น GPU ที่ออกแบบมาเพื่อใช้ประมวลผล AI เป็นการเฉพาะ

NVIDIA เผยว่า GPU ตระกูล Blackwell อย่าง B200 มีทรานซิสเตอร์มากกว่า 208,000 ล้านตัว สร้างขึ้นโดยใช้กระบวนการผลิตแบบ 4 นาโนเมตร (4NP) ของ TSMC ซึ่งล้ำหน้าที่สุดในปัจจุบัน ทำให้สามารถวางทรานซิสเตอร์ที่มีขนาดเล็กลงได้มากขึ้น จำนวนทรานซิสเตอร์นี้มากกว่า H100 ที่ใช้สถาปัตยกรรมรุ่นก่อนหน้าอย่าง Hopper ถึงกว่า 2 เท่า (H100 มีทรานซิสเตอร์ราว 80,000 ล้านตัว)

สถาปัตยกรรม Blackwell (ที่มา NVIDIA)

หน้าตาของชิป B200 จะเป็นแผ่นวงจรชิปสองแผ่นที่มีระบบเชื่อมต่อด้วยความเร็ว 10 เทระไบต์ต่อวินาที แต่ทำงานเสมือนเป็น GPU ตัวเดียวกัน ต่างจาก GPU รุ่นเดิม ๆ ที่มีแผ่นชิปเพียงแผ่นเดียว แต่ละแผ่นมีหน่วยความจำประเภท HBM3e ขนาดหน่วยความจำ 24 จิกะไบต์ เรียงกัน 4 ตัว รวม 192 จิกะไบต์ มีแบนด์วิทการส่งข้อมูลรวมกันมากถึง 8 เทระไบต์ต่อวินาที มีระบบเชื่อมต่อ NVLink ความเร็ว 1.8 เทระไบต์ต่อวินาที

หมวด/สถาปัตยกรรมHopperBlackwell
วางจำหน่าย20 กันยายน 2022ไตรมาส 4 2024
กระบวนการผลิต (ผู้ผลิต)4N (TSMC)4NP (TSMC)
หน่วยคำนวณทศนิยม Deep LearningFP8 (คำนวณสูงสุด 4 เพตะฟล็อบส์)FP4 (คำนวณสูงสุด 20 เพตะฟล็อบส์)
จำนวนทรานซิสเตอร์80,000 ล้าน (ใน B100/B200)280,000 ล้าน
หน่วยความจำ141 จิกะไบต์ (H200)192 จิกะไบต์ (B200)
แบนด์วิท4.8 เทระไบต์ต่อวินาที (H200)8 เทระไบต์ต่อวินาที (B200)

ผลิตภัณฑ์ Blackwell ยังมีอีกหลายตัวอย่าง HGX B200 ที่ใช้ B200 8 ตัว รวมเข้ากับ CPU ที่ใช้สถาปัตยกรรม x86 ของ CISC และ HGX B100 ที่คล้ายกับ HGX B200 แต่จะลดสเปกลงมาหน่อย หรืออย่าง อย่างซูเปอร์ชิป Grace Blackwell GB200 ที่รวมระหว่าง Blackwell กับสถาปัตยกรรม Grace ของฝั่ง CPU การรวมร่างนี้ยิ่งทำให้ประสิทธิภาพการประมวลผลมากกว่า B200 ที่ใช้ Blackwell เพียงอย่างเดียวถึง 2 เท่า แต่ก็กินไฟรวมกันมากถึง 2700 วัตต์

ในส่วนของราคา คาดว่าราคาเปิดตัวของ B200 น่าจะสูงถึง 40,000 เหรียญ (ประมาณ 1.3 ล้านบาท) ขณะที่ตัวที่ได้รับการปรับแต่งมาแล้วอย่าง DGX B200 ที่ใช้ B200 8 ตัว มีข้อมูลว่าราคาพุ่งทะลุ 500,000 เหรียญ (ราว 16.5 ล้านบาท) เรียกได้ว่าสำหรับบริษัทเล็ก หรือสตาร์ตอัปที่อยากได้ไปครอบครอง ก็เป็นการลงทุนมหาศาลเลยทีเดียว

เกิดมาเพื่อ AI

ประสิทธิภาพการประมวลผลในระดับเพตะฟล็อบส์สะท้อนว่า Blackwell ออกแบบมาเพื่อให้ประมวลผล AI ได้อย่างรวดเร็วและแม่นยำ ตัว Blackwell ยังใช้เอนจิน Transformer ในเจเนอเรชันที่ 2 ที่ใช้ประโยชน์จากคอร์ Tensor ที่เร่งประสิทธิภาพในการฝึกและการดึงข้อสรุปจากข้อมูลใหม่ ๆ สำหรับโมเดล AI ประเภทโมเดลภาษาขนาดใหญ่ (LLMs) และโมเดล MoE ด้วย

สำหรับหน่วยคำนวณทศนิยมในงาน Deep Learning น้้น B200 ใช้ FP4 (ความแม่นยำระดับ 4 บิต) มีประสิทธิภาพในการประมวลผลข้อมูล (Throughput) ได้สูงถึง 20 เพตะฟล็อบส์ (1 เพตะฟล็อบส์ = การคำนวณ 1,000 ล้านล้านครั้งใน 1 วินาที) ซึ่งสูงกว่า FP8 (ความแม่นยำระดับ 8 บิต) ซึ่งเป็นฟอร์แมตก่อนหน้าถึง 2 เท่า อีกทั้งยังลดเวลาและทรัพยากรที่ใช้ด้วย

NVIDIA ชี้ว่า FP4 จะช่วยเพิ่มประสิทธิภาพและขนาดของโมเดล AI ที่่หน่วยความจำรองรับได้ถึง 2 เท่า และยังคงไว้ซึ่งความแม่นยำในการคำนวณที่สูงมาก

นอกจากนี้ Blackwell ยังรองรับการประมวลผล FP6 ซึ่งเป็นฟอร์แมตการประมวลผลแบบใหม่ เพื่อมารองรับการทำงานของ FP4 ที่ขาดหายไป และยังใช้ฟอร์แมตอื่นอย่าง FP8, FP16, FP64 และ TF32 เข้ามาร่วมในการประมวลผลด้วย การผสมผสานนี้มีชื่อเรียกว่า Mixture of Experts (MoE)

Blackwell ยังมีเทคโนโลยีอีก 3 อย่างที่พัฒนามาเพิ่มเสริมประสิทธิภาพการพัฒนา AI ได้แก่ NVLink เจเนอเรชันที่ 5 ที่เร่งประสิทธิภาพโมเดล AI ระดับหลายล้านล้านพารามิเตอร์ (GPT4 มี 1.7 ล้านล้านพารามิเตอร์) และยังเสริมการเชื่อมต่อความเร็วสูงระหว่าง GPU ได้สูงสุด 576 ตัว เอนจิน RAS ที่มาพร้อมกับ Blackwell ที่จะมาคอยดูแลความเสถียรและปัญหาต่าง ๆ ที่อาจเกิดขึ้นต่อตัว GPU และ Secure AI ระบบการรักษาความลับของโมเดล AI และข้อมูลลูกค้าโดยไม่ไปลดประสิทธิภาพการประมวลผล

เจ้าใหญ่เล็งอยากได้มาครอบครอง

ลูกค้าของ Blackwell ส่วนใหญ่เป็นบริษัทเทคโนโลยีผู้นำในตลาด ที่อยากได้เทคโนโลยีแห่งอนาคตตัวนี้ไปใช้พัฒนาระบบประมวลผล AI มีตั้งแต่ Google, Meta, Microsoft, Oracle และ Amazon Web Service ที่ต่างมาจับจอง Blackwell กันจนเกลี้ยง

แม้ว่าก่อนหน้านี้จะมีปัญหาที่ทำให้ผลิตภัณฑ์ Blackwell สำหรับใช้ในคอมพิวเตอร์สมรรถนะสูง (HPC) และสำหรับประมวล AI ต้องกลับมาทำการออกแบบใหม่อีกครั้ง จนการส่งให้ลูกค้าล่าใช้ไปกว่าเดิม แต่นั่นก็ไม่ได้ทำให้ความต้องการลดลง

เซิร์ฟเวอร์ GB200 ของ Azure (ที่มา Microsoft)

Microsoft Azure ผู้ให้บริการคลาวด์ในเครือ Microsoft ก็ออกมาอวดโฉมเซิร์ฟเวอร์คลาวด์เครื่องแรกของโลกที่ใช้ GB200 ซึ่งคาดว่าน่าจะใช้ B200 ถึง 32 ตัว เช่นเดียวกับ อีลอน มัสก์ (Elon Musk) เจ้าของ xAI (และอีกหลายบริษัท) ก็อยากได้ B200 ถึง 300,000 ตัวไปสร้างซูเปอร์คอมพิวเตอร์พัฒนา AI

หรืออย่าง Foxconn ที่มีข่าวว่าอยากจะร่วมกับ NVIDIA สร้างซูเปอร์คอมพิวเตอร์ที่ดึงศักยภาพของ GB200 ให้มีพลังการคำนวณได้สูงสุด 80 เอ็กซาฟล็อบส์ (1 เอ็กซาฟล็อบส์ = 1,000 เพตาฟล็อบส์)

นักวิเคราะห์จาก Morgan Stanley เผยโดยอ้างข้อมูลจากการประชุมกับผู้บริหาร NVIDIA ว่า GPU ตระกูล Blackwell ขายหมดแล้วไปอีก 12 เดือนครั้งหน้า ด้าน โคเลตต์ เครสส์ (Colette Kress) กล่าวในประชุมรายรับครั้งที่ผ่านมาว่า Blackwell น่าจะทำรายได้ให้กับบริษัทได้หลายพันล้านเหรียญภายในไตรมาสที่ 4 ของปีนี้

หวงระบุว่าความต้องการซื้อ Blackwell ตั้งแต่ยังไม่ได้เปิดขายนั้น ‘บ้ามาก’ หลายฝ่ายเชื่อว่า Blackwell จะทำให้รายได้ของ NVIDIA ที่เป็นเจ้าตลาดชิป AI อยู่แล้วยิ่งพุ่งกระฉูดเข้าไปอีก

ตัวชิป B200 ในช่วงเริ่มแรกจะขายเฉพาะกับลูกค้าธุรกิจก่อน ส่วนผลิตภัณฑ์สำหรับลูกค้าทั่วไปน่าจะมาอย่างน้อยก็ในปี 2025

มุมแดงส่งท้าชิง

การเปิดตัวของ Blackwell สร้างแรงกระเพื่อมไปทั่ววงการชิป AI แน่นอนว่าคู่แข่งรายสำคัญอย่าง AMD ที่่แข่งขันชิงส่วนแบ่งตลาดชิป AI ย่อมไม่อยู่เฉยก็มีส่งของตัวเองเข้าประกวดเช่นกัน โดยเฉพาะ AMD, Intel และผู้ให้บริการคลาวด์ที่มีเทคโนโลยีเป็นของตัวเองที่ห้ำหั่นกันมาอย่างยาวนาน

AMD ประกาศท้าสู้ด้วยชิป AI ชื่อรุ่น Instinct MI325X ที่ใช้สถาปัตยกรรม CDNA 3 ที่แม้จะยังเทียบสเปก B200 ไม่ได้ แต่ก็อ้างว่าเหนือชั้นกว่า H200 ในแง่ของแบนด์วิทและความจุของหน่วยความจำ และยังมีแผนใช้ CDNA 3 เพื่อแหกขีดความสามารถ AI ในระยะยาวในระดับหลายปีด้วย

NVIDIA จะครองบัลลังก์ AI นานแค่ไหน

นักวิเคราะห์ประเมินว่า NVIDIA ครองส่วนแบ่งตลาดชิป AI สำหรับการฝึกและพัฒนาโมเดล AI ในปัจจุบันมากถึง 70% – 95% ทิ้งห่างคู่แข่งอย่างเทียบไม่ติด ไหนจะการที่ NVIDIA คอยเบียดบริษัทที่มีมูลค่าตลาดสูงที่สุดในโลกกับ Apple และ Microsoft ขึ้นไปเป็นที่ 1 อยู่เสมอด้วย

การที่ถือครองตลาดในระดับนี้แล้วยังทยอยเข็นชิปรุ่นใหม่ที่ประสิทธิภาพสูงขึ้นเรื่อย ๆ ในยุคที่ AI กลายเป็นเทคโนโลยีหลักที่แข่งขันทั่วโลก ก็อาจจะทำให้เจ้าอื่นมาสอย NVIDIA ลงจากบัลลังก์ได้ยาก

อย่างไรก็ดี ชิปในตระกูล Blackwell ก็ยังต้องพิสูจน์ตัวเองอีกนาน ๆ ว่าจะกลายเป็นตัวที่ยิ่งมาตอกย้ำความเป็นเจ้าพ่อชิป AI หรือจะมีเจ้าใหม่แซงขึ้นมาเร็ว ๆ นี้