Tridinews.com - Cloudflare akhirnya menjelaskan apa yang menyebabkan layanan mereka sempat tumbang dan membuat banyak situs di internet tidak bisa diakses. CEO Cloudflare, Matthew Prince, mengatakan bahwa biang keroknya adalah kesalahan instruksi yang diberikan ke Basis Data ClickHouse, tempat perusahaan menyimpan dan mengelola data penting. Pernyataan ini disampaikan melalui laporan yang dikutip The Verge.
Masalah bermula ketika sistem menerima instruksi yang salah, yang kemudian menyebabkan ClickHouse menggandakan aturan kerja sistem bot berulang kali. Sistem manajemen bot—yang bertugas memfilter dan mengatur aktivitas program otomatis—langsung kewalahan karena dibanjiri data yang tidak semestinya.
Akibat kepadatan data tersebut, sistem bot gagal bekerja. Sebagai langkah pengamanan, sistem proksi inti Cloudflare otomatis menutup banyak koneksi untuk mencegah bot jahat lolos tanpa pemeriksaan. Sayangnya, tindakan darurat ini juga membuat pengguna asli tidak bisa mengakses situs yang menggunakan layanan Cloudflare.
Cloudflare sebelumnya menyebut bahwa sekitar 20 persen internet berjalan di atas jaringannya. Layanan ini biasanya menjadi benteng yang menjaga situs tetap online saat menghadapi lonjakan trafik maupun serangan DDoS. Namun kali ini, justru kesalahan internal membuat koneksi terputus massal.
Dampaknya terasa luas. Layanan seperti X (Twitter), ChatGPT, hingga Downdetector sempat ikut tumbang selama beberapa jam. Kejadian ini bahkan mirip dengan gangguan yang sebelumnya dipicu masalah di Microsoft Azure dan Amazon Web Services.
Untuk mencegah insiden serupa terulang, Cloudflare menyiapkan empat langkah perbaikan, termasuk meningkatkan cara sistem menerima data baru, menambahkan tombol darurat tambahan, serta melakukan pemeriksaan ulang terhadap semua sistem kritis.
Cloudflare Ungkap Penyebab Gangguan Besar yang Lumpuhkan Banyak Situs
. (net)