ในบทความนี้เรายังอยู่กับ Sony ในประเทศญี่ปุ่นเพื่อเรียนรู้เทคโนโลยีอย่างลึกที่ประกอบกันขึ้นมาเป็น Sony Xperia XZ2 ครับ ซึ่งเซสชั่นที่เราทึ่งที่สุดในทริปมาเยือนโตเกียวในครั้งนี้คือการได้มาเยือนสตูดิโอของ Sony Music ครับ โดยคุณ Koji Suzuki – Mastering Engineer, Sony Music Studio Tokyo อธิบายระบบทั้งหมดที่มีรายละเอียดหยิบย่อยสมกับที่เป็นสตูดิโอบันทึกเสียง คือ

Koji Suzuki – Mastering Engineer, Sony Music Studio Tokyo

  • ระบบไฟในสตูดิโอมีทั้ง 100v, 117v และ 220v เพื่อรองรับเครื่องดนตรีต่างๆ แน่นอนว่าไฟฟ้าในสตูดิโอต้อง Clean ทั้งหมด กรอง Noise ที่จะทำให้เกิดเสียงรบกวนออกไปแล้ว
  • ห้องมิกซ์ เป็นคอนโซลอนาล็อกของอังกฤษ ใช้มา 16 ปี ไม่เคยมี Noise
  • ส่วนเชื่อมโลหะใช้ทองทั้งหมด
  • มี 5 สตูดิโอย่อย สามารถกั้นเสียงแยกกันได้ทั้งหมด จึงใช้งานได้พร้อมกัน กำแพงคอนกรีตหนัก 120 ตัน กันเสียง
  • ไมค์ของ Sony ทำวิจัยและพัฒนาในสตูดิโอนี้ด้วย
  • ออกแบบโดยผู้เชี่ยวชาญชาวอเมริกา

แวะฟังเพลงในสตูดิโอจาก YUKI มือกีต้าร์สาว!

Play video

ชื่อชั้นของเครื่องเสียง Sony เราคงรู้กันดีอยู่นะครับ แต่การได้มาเจอคุณ Kenichi Matsumoto – Senior Engineer, Audio, Sony Mobile Communication วิศวกรเรื่องเสียงตัวจริงของโซนี่ทำเอาเราปลื้มปริ่มมาก เพราะพี่แกเก่งสุดๆ คุณลุง Matsumoto เล่าถึงความจำเป็นของระบบเสียง Hi-Res อย่างเห็นภาพว่า

คนเราไม่ได้ยินเสียงจากหูอย่างเดียว แต่สมองมนุษย์สามารถรับคลื่นเสียงที่เราไม่ได้ยินได้มากกว่านั้น เสียงที่มนุษย์ได้ยินจึงมีมิติ มีการสะท้อน สามารถระบุดำแหน่งเสียง หรือขนาดห้องได้ เช่นเสียงของเข็มที่ตกในห้อง นอกจากเสียงกระทบของเข็มกับพื้นแล้ว ยังมีเสียงที่ชิ่งกับผนังห้องไปในทิศทางต่างๆ ที่คนได้ที่รับการฝึกฝนจะสามารถบอกตำแหน่งหรือถึงขนาดห้องได้เลย แต่ในยุคแรกที่โซนี่กับฟิลิปส์พัฒนา CD ขึ้นมานั้นยังไม่ได้คำนึงถึงเรื่องนี้ เลยตัดคลื่นเสียงที่มนุษย์ไม่ได้ยินออก ซึ่งระบบเสียง Hi-Res สามารถดึงข้อมูลส่วนนี้มาแสดงได้

Play video

  • CD จะบันทึกเสียงที่ความละเอียด 44,100 Hz (ค่านี้เรียกว่า Sampling Rate หรืออัตราการกำหนดจุดเก็บข้อมูลใน 1 วินาที) ที่ความลึก 16 Bit ซึ่งสามารถเก็บเสียงช่วง 20 – 20,000 Hz ที่มนุษย์ได้ยินได้ และสามารถบันทึกความแตกต่างของเสียง (Dynamic Rate) ได้สูงสุด 96 dB ซึ่งก็สามารถบันทึกเสียงที่แตกต่างกันของวงออเคสตราได้
  • ทำไมถึงต้องเป็น 44,100 Hz 16 bit ตัวเลขนี้ได้มาจากทฤษฎีว่า Sampling Rate ควรมีความถี่อย่างน้อย 2 เท่าของเสียงที่มนุษย์ได้ยิน แล้วเผื่อไปอีก 10% จึงได้ตัวเลขเป็น 20khz (ความถี่เสียงสูงสุดที่หูมนุษย์รับได้) + 10%x2 + 0.1khz = 44.1khz
  • รูปแบบ Hi-Res ทั่วไปจะบันทึกเสียงที่ความละเอียด 96,000 Hz ที่ความลึก 24 Bit ก็ทำให้ได้รายละเอียดของเสียงที่ดีกว่า สามารถบันทึกเสียงที่ความถี่สูงถึง 48,000 Hz ได้ และบันทึกความแตกต่างของเสียงได้สูงสุดเกือบ 150 dB แถมก็ยังมีรูปแบบอื่นๆ ที่บันทึกเสียงได้ละเอียดกว่านี้ เช่นบันทึกเสียงที่ 192,000 Hz ความลึก 24 Bit จะสามารถเก็บความถี่เสียงได้สูงสุด 96,000 Hz
  • คิดภาพตามนี้นะครับ เสียงความถี่ 48,000 Hz เท่ากับสั่นสี่หมื่นแปดพันครั้งใน 1 วินาที กราฟเสียงจะเป็นลูกที่ถี่ยิบมาก ถ้าเราบันทึกเสียงที่ความละเอียด 44,100 Hz หรือ 1 วิลงจุดบันทึกสี่หมื่นครั้ง มันจะไม่สามารถบันทึกความละเอียดของกราฟที่ถี่ขนาดนั้นได้ มันเลยบันทึกเสียงสูงแบบนี้ไม่ได้ครับ

กราฟแสดงความสัมพันธ์ระหว่างข้อมูลการบันทึกเสียง กับช่วงความถี่และ Dynamic Range ที่บันทึกได้ (ภาพจาก Wikipedia)

คุณ Matsumoto เล่าถึงการออกแบบสมาร์ทโฟนให้รองรับเสียงคุณภาพสูงว่ายากกว่าการออกแบบเครื่องเล่นเพลงปกติ เพราะโทรศัพท์เป็นเครื่องมือสื่อสาร มีการรับคลื่นส่งคลื่นมากมาย จึงมี Noise เยอะเป็นเรื่องปกติ ไม่เหมือนเครื่องเล่นเพลงโดยเฉพาะที่ไม่ได้มีการเชื่อมต่อไร้สายมากขนาดนั้น การออกแบบสมาร์ทโฟนให้เสียงดี รองรับ Hi-Res จึงต้องคำนึกถึงเรื่องสัญญาณรบกวนด้วย

ว่าแล้วก็เอา Sony Xperia XZ2 ต่อออกลำโพงในสตูดิโอให้ฟังเพลง Hi-Res เสียงนี้เคลิ้มไปเลย

แล้วก็ถึงช่วงถามคำถามกับวิศวกรครับ เราก็ถามประเด็นเทคนิคคาใจ แล้วลุง Matsumoto ก็ตอบมาอย่างผู้รู้ เราชอบพี่วิศวกรญี่ปุ่นคนนี้มากจริงๆ

Kenichi Matsumoto – Senior Engineer, Audio, Sony Mobile Communication

ใน Sony Xperia XZ2 ตัดช่องหูฟัง 3.5 mm ออกไปแล้ว แล้วตัว DAC อยู่ที่ไหน

สำหรับ Sony Xperia XZ2 DAC อยู่ที่ตัวเครื่อง ในสายแปลงจะไม่มี ซึ่ง USB-C ตัวนี้รองรับสัญญาณอนาล็อกและดิจิทัลเลย

(คลิกอ่าน) รู้จัก DAC ตัวแปลงเสียงดิจิทัลเป็นอนาล็อก

DAC ย่อมาจากคำว่า Digital-to-analog converter ทำหน้าที่แปลงสัญญาณเสียงดิจิทัลให้กลายเป็นสัญญาณอนาล็อกสำหรับใช้กับลำโพงหรือหูฟัง ซึ่งเสียงจะดีหรือไม่ดี ส่วนหนึ่งก็มาจากวงจร DAC นี่แหละว่าดีแค่ไหน

ซึ่งในยุคสมัยของ USB-C ที่ตัดช่องหูฟัง 3.5 mm ออกไปแล้ว เราเลยสงสัยกันว่าแล้วเจ้า DAC มันจะไปอยู่ที่ไหนระหว่างอยู่ในเครื่องเหมือนเดิม แล้วส่งสัญญาณเสียงเป็นอนาล็อกผ่านช่อง USB-C หรือส่งสัญญาณเสียงเป็นดิจิทัลเลย แล้วไปแปลงเป็นอนาล็อกใน DAC ภายนอกหรือ DAC ที่อยู่ในสาย

เราจึงไปค้นมาตรฐาน USB-C มาครับ สรุปว่าการเชื่อมต่อ USB-C นั้นมีโหมดหนึ่งที่เรียกว่า Audio accessory mode ซึ่งจะส่งสัญญาณเสียงแบบอนาล็อกออกจากเครื่องไปเลยโดยตัว DAC จะอยู่ในสมาร์ทโฟน แบบที่ Sony Xperia XZ2 ทำได้ และมือถือหลายๆ รุ่นทำได้ ซึ่งทำให้ไม่ต้องใช้หัวแปลง USB-C เป็น 3.5 mm ที่ราคาแพงนัก แต่ก็ยังรองรับการส่งสัญญาณเสียงแบบดิจิทัลเพื่อนำไปใช้กับ DAC ภายนอกด้วย

แต่สำหรับสมาร์ทโฟนบางรุ่นอย่าง HTC U11 หรือ Google Pixel 2 นั้นไม่มี DAC อยู่ในตัวเลย เราจึงไม่สามารถใช้สาย USB-C to 3.5 mm ทั่วไปมาเสียบเพื่อฟังเพลงได้ จะต้องเป็นสายที่มี DAC อยู่ในตัว (ที่แถมมาในกล่อง) หรือหูฟังที่สามารถรับสัญญาณดิจิทัลได้โดยตรงครับ

ไมค์ของโซนี่ก็พัฒนาในสตูดิโอนี้

ทำไมการฟังเพลงผ่าน Bluetooth จึงไม่สามารถใช้ DSEE HX ได้?

DSEE HX หรือ Digital Sound Enhancement Engine Hi-Res คือซอฟต์แวร์ปรับปรุงคุณภาพเสียงที่โซนี่พัฒนาขึ้นมาเอง เพื่อชดเชยรายละเอียดของเสียงที่สูญเสียไประหว่างการบีบอัดเพลง โดย Resampling เสียงขึ้นไปในระดับ 96 kHz 24 bit ให้ได้เสียงใกล้เคียงกับมาตรฐาน Hi-Res ของโซนี่

ที่นี้กระบวนการทำงานของ Bluetooth คือการบีบอัดเสียงก่อนที่จะส่งไป ไม่งั้นข้อมูลจะเยอะเกินไปส่งผ่าน Bluetooth ไม่ไหว ซึ่งไม่ว่าจะใช้กระบวนการบีบอัดหรือ Codec ที่ดีแค่ไหน มันก็ต้องบีบอัดเสียง ตัดย่านเสียงที่คนส่วนใหญ่ไม่ได้ยินทิ้งอยู่ดี

เพราะฉะนั้นถ้าเราปรับปรุงคุณภาพเสียงด้วย DSEE HX ก่อน แล้วส่งด้วย Bluetooth มันก็ไร้ค่า เพราะมันคือการเพิ่มไปแล้วตัดออก ซึ่งส่งผลกระทบกับคุณภาพเสียง เราเลยปิดไม่ให้ใช้งาน DSEE HX กับการฟังด้วย Bluetooth บน Xperia XZ2 แต่ถ้าผู้ใช้ใช้อุปกรณ์ของ Sony เช่นลำโพงที่มี DSEE HX ในตัว ก็สามารถเปิดใช้งานที่ฝังลำโพงได้

(คลิกอ่าน) Codec เสียงของ Bluetooth ตัวชี้วัดคุณภาพเสียงไร้สาย!

คำว่า Bluetooth นั้นจริงๆ เป็นแค่ชื่อมาตรฐานการส่งสัญญาณระหว่างอุปกรณ์เท่านั้นครับ ซึ่ง Bluetooth เวอร์ชั่นสูงขึ้น ก็หมายถึงส่งสัญญาณไร้สายได้เร็วขึ้น แต่สัญญาณเสียงที่ส่งไปจะมึคุณภาพแค่ไหนก็ขึ้นอยู่กับการเข้ารหัสเสียงหรือ Codec ที่ใช้ด้วย

เทียบง่ายๆ ก็เหมือน Bluetooth คือรถตู้ที่วิ่งอยู่บนถนน เมื่อใช้ Bluetooth เวอร์ชั่นสูงขึ้นก็เหมือนอัปเกรดให้รถตู้ซิ่งแรงขึ้น ส่วน Codec ก็เหมือนสินค้าที่อยู่ในรถตู้ Codec คุณภาพดีก็เหมือนสินค้าคุณภาพดีแหละครับ

ซึ่งในโลกของ Bluetooth เราใช้ Codec 4 ตัวหลักๆ และอีก 1 มาตรฐานใหม่ที่มาเข้าชิงคือ

  • SBC (subband codec) มาตรฐานการบีบอัดเสียงพื้นฐานของ Bluetooth ที่อย่างน้อยๆ อุปกรณ์ Bluetooth ทั้งโลกต้องจัดการเสียงแบบ SBC ได้ ซึ่งรูปแบบนี้ก็ให้เสียงคุณภาพพื้นฐาน คือไม่ได้แย่ แต่ก็ไม่ได้ดีสำหรับที่นักฟังเพลงจริงๆ ต้องการ ใช้ bit rate ประมาณ 328 kbps
  • AAC (Advanced Audio Coding) รูปแบบการบีบอัดเสียงใช้ในอุปกรณ์ของแอปเปิ้ล และสมาร์ทโฟนหลายๆ รุ่น ให้คุณภาพเสียงที่ดีกว่า SBC
  • LDAC รูปแบบการบีบอัดเสียงที่ Sony พัฒนาขึ้นเพื่อส่งเสียงระดับ Hi-Res ผ่าน Bluetooth โดยให้ bit rate สูงสุดถึง 990 kbps รองรับความละเอียดเสียงแบบ Hi Res 24-bit 96 kHz ซึ่งเป็น codec ด้านเสียงสำหรับ Bluetooth ที่คุณภาพสูงมากตอนนี้ ตอนนี้ใช้ได้กับอุปกรณ์ของ Sony เป็นหลัก แต่ใน Android 8 Oreo มาตรฐาน LDAC ได้เข้าเป็นส่วนหนึ่งของ Android แล้ว ซึ่งผู้ผลิตสามารถเลือกได้ว่าจะใส่ LDAC เข้าไปในอุปกรณ์ตัวเอง แต่ก็ต้องมีการตกลงใช้สิทธิ์กับ Sony ก่อนผลิตด้วยนะ ไม่ใช่เป็น Android 8 แล้วจะใช้ LDAC ได้เลย
  • aptX รูปแบบการบีบอัดเสียงยอดนิยมอีกแบบ ให้คุณภาพเสียงที่ดีกว่า SBC และมี Latency ต่ำ (คือเสียงไม่แลค เหมาะสำหรับการเล่นเกม) มาตรฐานของ aptX จะใช้บิทเรท 352 kbps สำหรับเสียงสเตอริโอ 16-bit 44.1 kHz และมีมาตรฐานใหม่คือ aptX HD ที่รองรับเสียง 24-bit 48 kHz จะใช้บิทเรท 576 kbps ซึ่งตอนนี้ aptX ก็แพร่หลายมากขึ้นหลังจากรวมอยู่ใน Android 8.0
  • HWA (Hi-res Wireless Audio) รูปแบบการส่งสัญญาณเสียงผ่าน Bluetooth ตัวล่าสุดที่พัฒนาโดยหัวเว่ย ใช้เทคโนโลยีที่เรียกว่า LHDC (low latency and high-definition audio codec) ในการบีบอัดเสียง ให้อัตราการส่งสัญญาณที่ 900 kbps เริ่มใช้ใน Huawei P20 เป็นรุ่นแรก แต่ยังไม่เป็นที่นิยมในปัจจุบัน

แถมภาพน้อง YUKI ให้อีกภาพหนึ่ง