NPU เป็นศัพท์ใหม่ในวงการ AI ที่กำลังมาแรงตอนนี้ ซึ่งสร้างความสับสนให้กับหลายคนที่แม้แต่ CPU หรือ GPU ก็ยังสับสนว่ามันต่างกันยังไง ซึ่งคนทั่วไปก็อาจไม่รู้ว่า NPU เริ่มสอดแทรกเข้ามาในอุปกรณ์ไอทีที่เราใช้กันบ้างแล้ว บทความนี้จะเล่าให้เห็นว่า NPU คืออะไร และมันสำคัญกับวงการ AI และชีวิตประจำวันอย่างไรบ้าง

NPU เกิดมาเพื่อ AI

เริ่มที่ความหมายกันก่อน NPU ย่อมาจาก Neural Processing Unit หรือแปลว่าหน่วยประมวลผลประสาท ซึ่งเป็นชิปหน่วยประมวลผลที่ได้รับการออกแบบมาเพื่อรองรับการทำงานของ AI โดยเฉพาะ

NPU ยังถูกออกแบบมาเพื่อเร่งการทำงานของ Neural Network หรือโครงข่ายประสาทที่สร้างขึ้นเลียนแบบวิธีการทำงานของระบบสมองของมนุษย์ และเป็นหัวใจในการทำงานของ AI

NPU ยังมีความเชี่ยวชาญในการทำงานที่เกี่ยวกับ AI เช่น การจดจำเสียง การเบลอภาพพื้นหลังของวิดีโอคอล และกระบวนการในการตัดต่อสื่อต่าง ๆ

ที่ NPU ทำได้มากขนาดนี้ก็เป็นผลมาจากเขียนโปรแกรมลงบนซอฟต์แวร์และฮาร์ดแวร์ที่มีความเฉพาะทาง ออกแบบมาเพื่อสำหรับการคำนวณบนโครงข่ายประสาทและ AI เป็นการเฉพาะ

ต่างจาก CPU และ GPU ยังไง

สิ่งที่ทำให้ NPU แตกต่างจากชิปประมวลอื่น ๆ (เช่น CPU และ GPU) ก็คือ NPU เกิดมาเพื่อการคำนวณแบบขนานที่เน้นข้อมูลเป็นหลัก แถมยังมีความซับซ้อน ทำงานได้หลากหลาย และความยืดหยุ่นสูง ทำให้มันมีประสิทธิภาพในการประมวลข้อมูลภาพและวิดีโอขนาดมหึมาที่ใช้สำหรับการฝึกฝน AI และรองรับการประมวลผลโครงข่ายประสาทได้สูงมาก

การ์ดจอใช้ GPU ในการประมวลผลภาพอันสวยงานในเกม (ที่มา NVIDIA)

ส่วน CPU หรือ Central Processing Unit (หน่วยประมวลผลกลาง) เป็นเหมือนมันสมองของคอมพิวเตอร์ มันมีจำนวนคอร์น้อย เน้นทำงานทั่ว ๆ ไป แต่หลากหลาย เช่น รันโปรแกรม และใช้คำสั่งต่าง ๆ ซึ่งจะไม่ได้ออกแบบมาให้ทำงานเฉพาะทางเหมือน GPU และ NPU

ในทางกลับกัน GPU หรือ Graphic Processing Unit (หน่วยประมวลกราฟิก) มีคอร์ หรือหน่วยการประมวลผลในระดับฮาร์ดแวร์ ในการคำนวณงานทั่ว ๆ ไปในปริมาณที่มากกว่า เนื่องจากมีคอร์ที่มากกว่า แต่จะไม่ซับซ้อนเท่ากับ NPU เหมาะสำหรับทำงานหนักแต่ไม่ซับซ้อนมากอย่างการเรนเดอร์กราฟิก

CPUGPUNPU
คอร์น้อย เน้นทำงานทั่ว ๆ ไปแต่หลากหลาย คอร์มากที่สุด เน้นทำงานอย่างเดียวแต่ทำหนัก แบ่งการทำงานเป็นหลายส่วนเพื่อทำพร้อม ๆ กัน กินไฟมากคอร์มากกว่า CPU แต่ไม่เท่า GPU เน้นการประมวล AI ที่เป็นงานเบา ๆ แต่ทำซ้ำ ๆ กินไฟน้อย

NPU เน้นการประมวลผลงาน AI เบา ๆ ซ้ำ ๆ กัน ด้วยประสิทธิภาพที่สูงกว่าและใช้พลังงานน้อยกว่า แต่ถ้าเป็นงานหนัก ๆ ก็ยังคงต้องพึ่ง GPU ให้เข้ามาช่วยประมวลผลเหมือนเดิม

หน้าตาเป็นยังไง

ในระดับสินค้าบริโภค โดยมากแล้ว NPU จะถูกผนวกเข้ากับ CPU GPU หรือชิปประมวลผลอื่น ๆ อย่างในชิป Intel Core และชิปซีรีส์ Ryzen 8040 ของค่ายแดง สำหรับการประมวลผล AI แบบบนอุปกรณ์ (On-Device) เลย ส่วนใน SoC สำหรับสมาร์ตโฟนนั้นมี NPU อยู่ในตัวมานานตั้งแต่ยุค Huawei P20 Pro แล้ว

อย่างในค่ายเขียว NVIDIA จะใช้สิ่งที่เรียกว่า Tensor Core เช่นเดียวกับคู่แข่งอย่าง AMD และ Intel ก็ผนวก IC ในลักษณะนี้เข้าไปอยู่ใน GPU ที่ใช้บนแล็ปท็อป สมาร์ตโฟน และอุปกรณ์อื่นบ้างแล้ว

ขณะที่ในระดับอุตสาหกรรม หรือศูนย์ข้อมูล NPU จะถูกแยกต่างหากจากตัวประมวลผลอื่น ๆ บนเมนบอร์ด เพื่อให้มันทำงานเต็มประสิทธิภาพ

เจ้าดังขึ้นเรือ 'NPU'

แน่นอนว่ายักษ์ใหญ่วงการชิปก็ย่อมไม่พลาดการแข่งขันขุมทรัพย์ใหม่อย่าง NPU

คู่แข่งสำคัญอย่าง AMD ที่หมายมั่นจะท้าชน NVIDIA ที่เป็นเจ้าตลาดชิปประมวลผล AI ก็ประกาศ XDNA สถาปัตยกรรมชิป NPU มาสู้ด้วย โดย XDNA จะมีหน่วยความจำและตัวจัดการกระแสข้อมูล (Data Flow) บนชิปสำหรับ AI แทนการต้องไปดึงมาจากแคช เพื่อลดการใช้พลังงานและเพิ่มประสิทธิภาพการประมวลผล AI

เช่นเดียวกับ Intel ที่กำลังลุ้นว่าจะตกขบวนจากการที่เจ้าดังเริ่มทิ้งตัวเองไปใช้สถาปัตยกรรมของ ARM ก็ประกาศเปิดตัวสถาปัตยกรรมชิปใหม่ที่รวมเอา NPU มาไว้เหมือนกัน ทั้ง Meteor Lake ที่ใช้บนมือถือ และ Lunar Lake สำหรับบนคอมพิวเตอร์

NVIDIA Ada Lovelace

NVIDIA พัฒนาชิป GPU ที่ใช้สถาปัตยกรรม Ada Lovelace สำหรับแล็ปท็อปที่มาพร้อมกับ NPU (ในรูปแบบของ Tensor Core) เพื่อให้ NPU รองรับการประมวลผล AI ในหน้างานเบา ๆ ส่วนงานหนัก ๆ ก็ให้ GPU มาช่วยอุ้ม

ใครมาเหนือ

สำหรับประสิทธิภาพของแต่ละค่ายนั้น ปัจจุบันมีหน่วยในการวัดการประมวลผล AI ที่เรียกว่า TOPS ย่อมาจาก Trillions of Operations Per Second หรือคำสั่งในระดับล้านล้านคำสั่งที่ตัวประมวลผลจะประมวลผลได้ต่อวินาที

ทางฝั่งของมือถือ Meteor Lake ของ Intel มีความสามารถสูงสุดอยู่ที่ราว 11.5 TOPS ส่วน Ryzen AI 300-series ชิปมือถือของ AMD ระบุว่ามีประสิทธิภาพแรงทะลุ 50 TOPS

TOPS ของ NPU บนมือถือTOPS ของ NPU บน PC และแล็ปท็อป
11.5 ~ 5038 – 1,300

ในฝั่งของ PC และแล็ปท็อป เริ่มจาก Intel ประกาศว่า NPU 4 ของ Lunar Lake จะมีประสิทธิภาพอยู่ที่ราว 48 TOPS แต่เมื่อรวมกับ CPU และ GPU ที่อยู่บนชิปจะรวมกันได้มากถึง 120 TOPS

ทางด้าน Qualcomm ก็ไม่น้อยหน้า โฆษณาว่าชิป Snapdragon X-Series ของตัวเองที่มี NPU ประกบมาด้วยสามารถทำได้ถึง 45 TOPS ส่วน M4 ชิปเรือธงของ Apple อยู่ที่ราว ๆ 38 TOPS

แต่ผู้ชนะในวงการ TOPS แน่นอนว่าคงเป็นเจ้าตลาดอย่าง NVIDIA ที่โฆษณาว่า GPU ในตระกูล Ada Lovelace มาพร้อมกับ NPU ที่รวมกันแล้วมีค่า TOPS อย่างน้อย 154 และสูงสุดเป็นของ RTX 4090 ที่มีค่า TOPS ทะลุ 1,300

เรียกได้ว่าทิ้งเจ้าอื่นไม่เห็นฝุ่นเลยทีเดียว

เป็นอนาคตที่ใกล้มาก ๆ

อย่างไรก็ดี ก็ไม่ใช่ทุกคนที่เชื่อมั่นใน NPU ขนาดนั้น บ้างก็ว่า NPU ไม่ได้จำเป็นในการประมวลผล AI เพราะ GPU ก็ทำได้อยู่แล้ว

ในขณะเดียวกันการที่ ทุกเจ้ายักษ์ใหญ่แข่งขันกันเพื่อพัฒนาสินค้าที่แปะป้าย AI ในแทบจะทุกอย่าง ตั้งแต่วิดีโอเกม ไปจนถึงเก้าอี้นวด เราน่าจะได้เห็นการแข่งขันพัฒนา NPU เป็นตัวของตัวเองได้มากขึ้นเรื่อย ๆ

ซึ่งก็คงต้องพิสูจน์กันต่อไปสำหรับเทคโนโลยีที่มีความใหม่มาก ๆ ระดับนี้