Minggu, 17 Maret 2019

Big Data


                Istilah Big Data sudah sangat sering kita dengar, istilah tersebut menggambarkan volume data yang besar. Big Data adalah data yang melebihi kapasitas pemrosesan system bisnis data konvensional. Data terlalu besar, bergerak terlalu cepat, atau tidak sesuai dengan struktur arsitektur basis data Anda. Untuk mendapatkan nilai dari data ini, Anda harus memilih cara alternative untuk memprosesnya – Edd Dumbill.
Data yang tidak terstruktur atau sensitif waktu atau sangat besar tidak dapat diproses oleh mesin basis data relasional. Tipe data ini membutuhkan cara pemrosesan yang berbeda yang menggunakan paralelisme massif pada hardware yang tersedia.

               Big Data sering digambarkan sebagai 3V (Volume, Variety and Velocity) : volume data yang ekstrem, variasi tipe data yang luas dan kecepatan dimana data harus diproses. Karakteristik tersebut diidentifikasi oleh Duog Laney seorang analis industri.

               Data yang begitu banyak dapat berasal dari berbagai sumber, seperti system transaksi bisnis, basis data pelanggan, catatan medis, log clickstream internet, aplikasi handphone, media sosial, hasil percobaan ilmiah, data yang dihasilkan oleh mesin, sensor data yang digunakan IoT. Data dapat dibiarkan dalam bentuk mentah atau diolah menggunakan data mining tools.

Seperti yang sudah dijelaskan, Big Data digambarkan sebagai 3V :
  • ·Volume : Data yang besar yang terkumpul dari berbagai sumber , termasuk transaksi bisnis, media sosial, dll.
  • ·Velocity : kecepatan data yang sangat cepat dimana data yang diterima di proses.
  • ·Variety : Berbagai jenis data yang tersedia , termasuk data terstruktur dalam database SQL dan Gudang data, data tidak terstruktur seperti file teks dan dokumen yang tersimpan dalam kelompok Hadoop atau system NoSQL.




0 komentar:

Posting Komentar