เมื่อวันที่ 10 กันยายนที่ผ่านมา เหตุแบตเตอรี่ลิเทียมระเบิดในศูนย์ข้อมูลของ Alibaba Cloud ที่อยู่ในสิงคโปร์ นำไปสู่เพลิงไหม้และอุณหภูมิที่สูงขึ้น ส่งผลให้เครือข่ายและคลาวด์ของ Alibaba ใน Zone C ของพื้นที่ดังกล่าวทำงานผิดปกติ จนเจ้าหน้าที่ดับเพลิงเข้าระงับเหตุ

ทั้งนี้ เจ้าหน้าที่ดับเพลิงสามารถระงับเหตุเพลิงไหม้ได้ในเวลาประมาณ 4 ชั่วโมงหลังจากเริ่มพบความผิดปกติ แต่ศูนย์ข้อมูลยังมีอุณหภูมิที่สูงอยู่ ซึ่งการปฏิบัติหน้าที่ของเจ้าหน้าที่ดับเพลิงทำให้น้ำสะสมอยู่ในศูนย์ข้อมูลจนเกิดการรั่วไหล และอาจกระทบต่อการทำงานของระบบอิเล็กทรอนิกส์

โดยในวันที่ 11 กันยายน Alibaba Cloud แถลงว่าระบบคลาวด์ส่วนใหญ่ที่ได้รับผลกระทบสามารถกลับมาทำงานได้ตามปกติแล้ว เว้นแต่เซิร์ฟเวอร์ที่มีความเสียหายเชิงกายภาพเท่านั้นที่รอการฟื้นฟูอยู่ ในขณะเดียวกันวิศวกรก็ยังไม่ได้รับอนุญาตให้กลับเข้าไปทำงานเนื่องจากความเสี่ยงเชิงกายภาพที่มีต่อตัวอาคาร โดยเซิร์ฟเวอร์ส่วนที่เหลือที่ไม่สามารถย้ายข้อมูลออกไปโดยอัตโนมัติต้องรอให้อุณหภูมิลดลงก่อน

ผลกระทบ

ลูกค้าธุรกิจที่ใช้บริการคลาวด์ของ Alibaba Cloud มีมากกว่า 11,000 บริษัททั่วโลก ทั้งในจีนและต่างประเทศ รวมถึงในไทยด้วย เหตุการณ์ที่เกิดขึ้นจึงกระทบกับการดำเนินธุรกิจจำนวนมาก ในไตรมาสที่ 1 ของปีนี้ Alibaba Cloud ยังมีส่วนแบ่งตลาดคลาวด์มากเป็นอันดับ 4 ของโลก

ที่มา Lazada

แน่นอนว่าลูกค้าใหญ่อย่าง ByteDance และ Lazada ต่างก็ออกมาระบุผลกระทบที่เกิดขึ้น โดย ByteDance เป็นบริษัทแม่ของ TikTok จากเหตุการณ์ที่เกิดขึ้นทำให้ผู้ใช้งานจำนวนมากเข้าใช้งานไม่ได้ในช่วงระยะเวลาหนึ่ง

หน้าเว็บ Lazada ในคืนวันที่ 11 กันยายน 2024

ขณะที่ในกรณีของ Lazada ทีมไอทีและผู้ขายของบนแพลตฟอร์มไม่สามารถเข้าไปใช้งานระบบเพื่อดูคำสั่งซื้อ หรือหากใช้ได้ ก็เจอความบกพร่องอย่างหนัก แต่ก็ยืนยันว่าลูกค้าจะได้รับสินค้าแน่นอน

สำหรับผู้ให้บริการในไทยอีกราย อย่าง Bilibili ก็ออกมาบอกว่า ‘ผู้ให้บริการเซิร์ฟเวอร์เกิดไฟไหม้’ ทำให้ลูกค้าไม่สามารถเข้าใช้งานบนเว็บไซต์และแอปฯ ได้ ซึ่งก็น่าจะหมายถึง Alibaba Cloud

หน้าเว็บ Bilibili ในวันที่ 12 กันยายน 2024 ที่ยังโหลดเนื้อหาไม่ได้

แล้วลูกค้าควรทำอย่างไร

ปัจจุบันธุรกิจหลายรายต่างก็ย้ายข้อมูลของตัวเองขึ้นคลาวด์ เพื่อลดค่าใช้จ่ายในการเก็บข้อมูลมหาศาลที่นับวันจะมากขึ้นไว้ในอุปกรณ์ภายในสำนักงานตัวเอง การเก็บข้อมูลในคลาวด์ยังช่วยลดความเสี่ยงต่อการดำเนินกิจการกรณีที่อุปกรณ์เก็บข้อมูลเสียหายด้วย แต่จะทำอย่างไรหากคลาวด์ที่เราใช้บริการอยู่เกิดขัดข้องเสียเอง เหมือนอย่างกรณีไฟไหม้ที่เกิดขึ้น ซึ่งส่งผลกระทบอย่างมหาศาลต่อธุรกิจและความเชื่อมั่นของลูกค้า

  • ในขั้นตอนของการเตรียมตัว ธุรกิจควรที่จะแบ่งประเภทของข้อมูลตามความสำคัญ โดยพิจารณาจากความสำคัญของข้อมูลต่อเป้าหมายการดำเนินธุรกิจ ซึ่งหากสำคัญมากก็ควรต้องสำรองข้อมูลไว้ในอุปกรณ์จัดเก็บบ่อย ๆ แต่หากไม่สำคัญมากนัก หรือไม่สำคัญเลยก็อาจไม่ต้องสำรองก็ได้
  • ควรมีอุปกรณ์จัดเก็บข้อมูลนอกคลาวด์หรือ On-Premises Storage เก็บเฉพาะข้อมูลสำคัญตามที่แบ่งไว้ข้างต้น

Hybrid Cloud กับ Multi-Cloud

  • ควรเลือกใช้นโยบายคลาวด์แบบผสมผสาน (Hybrid Cloud) โดยมีการจัดเก็บข้อมูลตัวเองนอกคลาวด์ที่เชื่อมต่อกับอินเทอร์เน็ตได้ ในขณะเดียวกันก็ต้องเหลือพื้นที่ไว้ส่วนหนึ่งสำหรับสำรองข้อมูลด้วย
  • ในการเลือกผู้ให้บริการคลาวด์ ควรจะออกแบบโครงสร้างพื้นฐานแบบหลายคลาวด์ (multi-cloud) ใช้คลาวด์จากหลายเจ้า เพื่อป้องกันเหตุคลาวด์ขัดข้อง โดยจะต้องมีระบบในการซิงก์ข้อมูลของทุกคลาวด์ให้ตรงกัน ซึ่งสามารถทำผ่านแพลตฟอร์มจัดการคลาวด์ หรือจะสร้างขึ้นมาเองก็ได้ และควรมีการตั้งค่าในการย้ายคลาวด์ทันทีเมื่อเกิดความผิดพลาด หรือที่เรียกว่า Failover

SLA

  • นอกจากนี้ ยังควรเลือกทำข้อตกลงระดับการให้บริการ (Service Level Agreement – SLA) กับผู้ให้บริการคลาวด์ในระดับสูง ๆ เพื่อให้มั่นใจว่าผู้ให้บริการคลาวด์จะให้บริการอย่างไร้รอยต่อ
  • ควรกำหนดกลยุทธ์การสำรองและฟื้นฟูข้อมูล (Backup and Recovery) ไว้ในอุปกรณ์ที่ตั้งอยู่นอกคลาวด์ ที่ทำให้มั่นใจได้ว่ามีการสำรองข้อมูลสำคัญอย่างสม่ำเสมอ มีหลากหลายอุปกรณ์จัดเก็บ และสามารถดึงข้อมูลกลับมาไว้ได้อย่างทันท่วงทีหากว่าคลาวด์ล่ม ที่สำคัญจะต้องมีกระบวนการทดสอบกลยุทธ์ที่กำหนดขึ้นมาด้วย
  • ควรมีระบบการแจ้งเตือนที่สามารถตรวจพบการล่มของคลาวด์ได้อย่างทันท่วงที เพื่อให้แก้ไขปัญหาได้ทัน

เมื่อคลาวด์ล่ม

  • ในขั้นตอนการเผชิญกับกรณีคลาวด์ล่ม ก็คือการต้องตรวจดูให้แน่ใจว่าความบกพร่องของระบบเกิดจากคลาวด์จริง ๆ โดยมีช่องทางให้ตรวจสอบจำนวนมาก ทั้งจากระบบการแจ้งเตือนที่ตั้งไว้ หรือบริการออนไลน์อย่าง Down Detector และ IsItDownRightNow รวมถึงการเข้าไปดูที่เว็บไซต์ของผู้ให้บริการเลย กรณีของ Alibaba เข้าไปที่ Alibaba Cloud Health Status
  • หากมั่นใจแล้วว่าคลาวด์ล่มก็ควรรีบติดต่อกับผู้ให้บริการคลาวด์ เพื่อรับการแก้ไข ซึ่งหากทำ SLA ไว้ในระดับที่สูงก็จะมีโอกาสได้รับการให้บริการก่อนใคร

ทั้งนี้ แม้ว่าทำทั้งหมดนี้แล้วก็ต้องอย่าลืมว่ายังมีภัยอื่น ๆ ที่กระทบต่อข้อมูลได้อีก ทั้งภัยไซเบอร์ ภัยจากคนใน และความเสียหายในด้านอื่น ๆ ก็คงต้องเตรียมมาตรการป้องกันไว้หลากหลายวิธีด้วย