Data Hantu dan Data Bocor
Assalamu'alaikum wr. wb
Belakangan ini rame wira wiri di media sosial adanya kebocoran data pribadi penduduk Indonesia sebanyak 279 juta record yang diduga dari basis data BPJS. Demikian juga ramenya informasi mengenai adanya data "hantu" dari ASN sebanyak 100-an ribu. Dua kasus tersebut menunjukan adanya kekurangan dalam pengelolaan data, khususnya dari sisi keamanan.
Sebanyak 1 juta record diberikan secara "cuma-cuma" untuk menunjukkan keseriusan bahwa memang benar adanya data bocor tersebut. Walau dalam beberapa statemen disebut bahwa dari 1 juta sample tersebut, "hanya" 100 an ribu data yang valid. Mengapa ada statemen ini, postingan blog yang lalu mungkin bisa menjadi gambaran.
Bagaimana bisa terdapat data bocor sebanyak 279 juta record tentu sangat mengejutkan. Dari data sample sebanyak 1 juta record dengan 30 kolom "memakan" tempat sebesar 50MB saat disimpan dalam file teks terkompres (.zip). Dan menjadi 242 MB saat sudah diekstrak kedalam format .CSV. Jika diasumsikan sejumlah 279 juta record memiliki jumlah kolom yang sama, maka bisa dibanyakan betapa besar data yang bocor ini (secara size dalam MB).
Sehingga kebocoran data ini, seperti disebut dalam beberapa forum diskusi besar kemungkinan dilakukan melalui jaringan lokal atau bahkan secara 'fisik' untuk bisa mendapatkan data ini. Dari sampel data yang diberikan ada kemungkinan bahwa data bocor tersebut merupakan hasil "dump" atau backup dari database yang berjalan.
Metode backup ke bentuk flat file seperti format .CSV merupakan teknik yang popular dilakukan oleh pengelola database. Dengan menggunakan format .CSV ini maka data-data yang dibackup menjadi lebih fleksible untuk "kemana-mana". Dengan format .CSV maka dengan mudah akan dibuka atau dipindah ke sistem lain.
Salah satu lubang keamanan yang sering kali dilupakan dalam pengelolaan basis data adalah pada saat melakukan backup ini. Saat melakukan backup data ke dalam bentuk flat file seperti .CSV atau .SQL maka data tersebut sama sekali tidak terlindungi. Sehingga dengan mudah bisa dibaca dengan menggunakan teks editor pada umumnya.
Peyimpanan hasil backup ini terkadang dilupakan. Saat hasil backup sudah jadi, maka proteksi pada hasil file tersebut menjadi sangat penting. Paling sederhana dengan memberikan proteksi dengan memberikan enkripsi pada hasil backup tersebut. Baik secara langsung atau menyimpannya dalam filesystem yang memiliki kemampuan enkripsi.
Hal lain yang bisa berujung pada lubang keamanan seperti data bocor dan data hantu adalah desain dari database yang digunakan. Nampak dari sampel data yang dibagi yakni banyaknya data "sampah" menunjukkan bahwa data backup (jika memang data bocor tersebut berasal) memiliki sumber yang desain database-nya besar kemungkinan juga "berantakan".
Demikian pula pada masalah adanya data "hantu" yang disebut di media berasal dari tahun 2014 maka juga bisa menunjukkan bahwa bisa jadi ada masalah seriyes dalam desain database yang digunakan. Dua kasus yang lagi rame tersebut dipastikan sistem databasenya menggunakan sistem basis data relasional. Sehingga nampaknya perlu peninjuan kembali sistem basis data yang digunakan bahkan mulai dari desainnya.
Bagaimana desain basis data yang baik ? kapan-kapan ntar ditulis di sini ya :D
Waalaikumsalam wr. wrb
Komentar