NPU เป็นศัพท์ใหม่ในวงการ AI ที่กำลังมาแรงตอนนี้ ซึ่งสร้างความสับสนให้กับหลายคนที่แม้แต่ CPU หรือ GPU ก็ยังสับสนว่ามันต่างกันยังไง ซึ่งคนทั่วไปก็อาจไม่รู้ว่า NPU เริ่มสอดแทรกเข้ามาในอุปกรณ์ไอทีที่เราใช้กันบ้างแล้ว บทความนี้จะเล่าให้เห็นว่า NPU คืออะไร และมันสำคัญกับวงการ AI และชีวิตประจำวันอย่างไรบ้าง
NPU เกิดมาเพื่อ AI
เริ่มที่ความหมายกันก่อน NPU ย่อมาจาก Neural Processing Unit หรือแปลว่าหน่วยประมวลผลประสาท ซึ่งเป็นชิปหน่วยประมวลผลที่ได้รับการออกแบบมาเพื่อรองรับการทำงานของ AI โดยเฉพาะ
NPU ยังถูกออกแบบมาเพื่อเร่งการทำงานของ Neural Network หรือโครงข่ายประสาทที่สร้างขึ้นเลียนแบบวิธีการทำงานของระบบสมองของมนุษย์ และเป็นหัวใจในการทำงานของ AI
NPU ยังมีความเชี่ยวชาญในการทำงานที่เกี่ยวกับ AI เช่น การจดจำเสียง การเบลอภาพพื้นหลังของวิดีโอคอล และกระบวนการในการตัดต่อสื่อต่าง ๆ
ที่ NPU ทำได้มากขนาดนี้ก็เป็นผลมาจากเขียนโปรแกรมลงบนซอฟต์แวร์และฮาร์ดแวร์ที่มีความเฉพาะทาง ออกแบบมาเพื่อสำหรับการคำนวณบนโครงข่ายประสาทและ AI เป็นการเฉพาะ
ต่างจาก CPU และ GPU ยังไง
สิ่งที่ทำให้ NPU แตกต่างจากชิปประมวลอื่น ๆ (เช่น CPU และ GPU) ก็คือ NPU เกิดมาเพื่อการคำนวณแบบขนานที่เน้นข้อมูลเป็นหลัก แถมยังมีความซับซ้อน ทำงานได้หลากหลาย และความยืดหยุ่นสูง ทำให้มันมีประสิทธิภาพในการประมวลข้อมูลภาพและวิดีโอขนาดมหึมาที่ใช้สำหรับการฝึกฝน AI และรองรับการประมวลผลโครงข่ายประสาทได้สูงมาก
ส่วน CPU หรือ Central Processing Unit (หน่วยประมวลผลกลาง) เป็นเหมือนมันสมองของคอมพิวเตอร์ มันมีจำนวนคอร์น้อย เน้นทำงานทั่ว ๆ ไป แต่หลากหลาย เช่น รันโปรแกรม และใช้คำสั่งต่าง ๆ ซึ่งจะไม่ได้ออกแบบมาให้ทำงานเฉพาะทางเหมือน GPU และ NPU
ในทางกลับกัน GPU หรือ Graphic Processing Unit (หน่วยประมวลกราฟิก) มีคอร์ หรือหน่วยการประมวลผลในระดับฮาร์ดแวร์ ในการคำนวณงานทั่ว ๆ ไปในปริมาณที่มากกว่า เนื่องจากมีคอร์ที่มากกว่า แต่จะไม่ซับซ้อนเท่ากับ NPU เหมาะสำหรับทำงานหนักแต่ไม่ซับซ้อนมากอย่างการเรนเดอร์กราฟิก
CPU | GPU | NPU |
---|---|---|
คอร์น้อย เน้นทำงานทั่ว ๆ ไปแต่หลากหลาย | คอร์มากที่สุด เน้นทำงานอย่างเดียวแต่ทำหนัก แบ่งการทำงานเป็นหลายส่วนเพื่อทำพร้อม ๆ กัน กินไฟมาก | คอร์มากกว่า CPU แต่ไม่เท่า GPU เน้นการประมวล AI ที่เป็นงานเบา ๆ แต่ทำซ้ำ ๆ กินไฟน้อย |
NPU เน้นการประมวลผลงาน AI เบา ๆ ซ้ำ ๆ กัน ด้วยประสิทธิภาพที่สูงกว่าและใช้พลังงานน้อยกว่า แต่ถ้าเป็นงานหนัก ๆ ก็ยังคงต้องพึ่ง GPU ให้เข้ามาช่วยประมวลผลเหมือนเดิม
หน้าตาเป็นยังไง
ในระดับสินค้าบริโภค โดยมากแล้ว NPU จะถูกผนวกเข้ากับ CPU GPU หรือชิปประมวลผลอื่น ๆ อย่างในชิป Intel Core และชิปซีรีส์ Ryzen 8040 ของค่ายแดง สำหรับการประมวลผล AI แบบบนอุปกรณ์ (On-Device) เลย ส่วนใน SoC สำหรับสมาร์ตโฟนนั้นมี NPU อยู่ในตัวมานานตั้งแต่ยุค Huawei P20 Pro แล้ว
อย่างในค่ายเขียว NVIDIA จะใช้สิ่งที่เรียกว่า Tensor Core เช่นเดียวกับคู่แข่งอย่าง AMD และ Intel ก็ผนวก IC ในลักษณะนี้เข้าไปอยู่ใน GPU ที่ใช้บนแล็ปท็อป สมาร์ตโฟน และอุปกรณ์อื่นบ้างแล้ว
ขณะที่ในระดับอุตสาหกรรม หรือศูนย์ข้อมูล NPU จะถูกแยกต่างหากจากตัวประมวลผลอื่น ๆ บนเมนบอร์ด เพื่อให้มันทำงานเต็มประสิทธิภาพ
เจ้าดังขึ้นเรือ 'NPU'
แน่นอนว่ายักษ์ใหญ่วงการชิปก็ย่อมไม่พลาดการแข่งขันขุมทรัพย์ใหม่อย่าง NPU
คู่แข่งสำคัญอย่าง AMD ที่หมายมั่นจะท้าชน NVIDIA ที่เป็นเจ้าตลาดชิปประมวลผล AI ก็ประกาศ XDNA สถาปัตยกรรมชิป NPU มาสู้ด้วย โดย XDNA จะมีหน่วยความจำและตัวจัดการกระแสข้อมูล (Data Flow) บนชิปสำหรับ AI แทนการต้องไปดึงมาจากแคช เพื่อลดการใช้พลังงานและเพิ่มประสิทธิภาพการประมวลผล AI
เช่นเดียวกับ Intel ที่กำลังลุ้นว่าจะตกขบวนจากการที่เจ้าดังเริ่มทิ้งตัวเองไปใช้สถาปัตยกรรมของ ARM ก็ประกาศเปิดตัวสถาปัตยกรรมชิปใหม่ที่รวมเอา NPU มาไว้เหมือนกัน ทั้ง Meteor Lake ที่ใช้บนมือถือ และ Lunar Lake สำหรับบนคอมพิวเตอร์
NVIDIA พัฒนาชิป GPU ที่ใช้สถาปัตยกรรม Ada Lovelace สำหรับแล็ปท็อปที่มาพร้อมกับ NPU (ในรูปแบบของ Tensor Core) เพื่อให้ NPU รองรับการประมวลผล AI ในหน้างานเบา ๆ ส่วนงานหนัก ๆ ก็ให้ GPU มาช่วยอุ้ม
ใครมาเหนือ
สำหรับประสิทธิภาพของแต่ละค่ายนั้น ปัจจุบันมีหน่วยในการวัดการประมวลผล AI ที่เรียกว่า TOPS ย่อมาจาก Trillions of Operations Per Second หรือคำสั่งในระดับล้านล้านคำสั่งที่ตัวประมวลผลจะประมวลผลได้ต่อวินาที
ทางฝั่งของมือถือ Meteor Lake ของ Intel มีความสามารถสูงสุดอยู่ที่ราว 11.5 TOPS ส่วน Ryzen AI 300-series ชิปมือถือของ AMD ระบุว่ามีประสิทธิภาพแรงทะลุ 50 TOPS
TOPS ของ NPU บนมือถือ | TOPS ของ NPU บน PC และแล็ปท็อป |
---|---|
11.5 ~ 50 | 38 – 1,300 |
ในฝั่งของ PC และแล็ปท็อป เริ่มจาก Intel ประกาศว่า NPU 4 ของ Lunar Lake จะมีประสิทธิภาพอยู่ที่ราว 48 TOPS แต่เมื่อรวมกับ CPU และ GPU ที่อยู่บนชิปจะรวมกันได้มากถึง 120 TOPS
ทางด้าน Qualcomm ก็ไม่น้อยหน้า โฆษณาว่าชิป Snapdragon X-Series ของตัวเองที่มี NPU ประกบมาด้วยสามารถทำได้ถึง 45 TOPS ส่วน M4 ชิปเรือธงของ Apple อยู่ที่ราว ๆ 38 TOPS
แต่ผู้ชนะในวงการ TOPS แน่นอนว่าคงเป็นเจ้าตลาดอย่าง NVIDIA ที่โฆษณาว่า GPU ในตระกูล Ada Lovelace มาพร้อมกับ NPU ที่รวมกันแล้วมีค่า TOPS อย่างน้อย 154 และสูงสุดเป็นของ RTX 4090 ที่มีค่า TOPS ทะลุ 1,300
เรียกได้ว่าทิ้งเจ้าอื่นไม่เห็นฝุ่นเลยทีเดียว
เป็นอนาคตที่ใกล้มาก ๆ
อย่างไรก็ดี ก็ไม่ใช่ทุกคนที่เชื่อมั่นใน NPU ขนาดนั้น บ้างก็ว่า NPU ไม่ได้จำเป็นในการประมวลผล AI เพราะ GPU ก็ทำได้อยู่แล้ว
ในขณะเดียวกันการที่ ทุกเจ้ายักษ์ใหญ่แข่งขันกันเพื่อพัฒนาสินค้าที่แปะป้าย AI ในแทบจะทุกอย่าง ตั้งแต่วิดีโอเกม ไปจนถึงเก้าอี้นวด เราน่าจะได้เห็นการแข่งขันพัฒนา NPU เป็นตัวของตัวเองได้มากขึ้นเรื่อย ๆ
ซึ่งก็คงต้องพิสูจน์กันต่อไปสำหรับเทคโนโลยีที่มีความใหม่มาก ๆ ระดับนี้