Istilah
Big Data sudah sangat sering kita dengar, istilah tersebut menggambarkan volume
data yang besar. Big Data adalah data yang melebihi kapasitas pemrosesan system
bisnis data konvensional. Data terlalu besar, bergerak terlalu cepat, atau
tidak sesuai dengan struktur arsitektur basis data Anda. Untuk mendapatkan
nilai dari data ini, Anda harus memilih cara alternative untuk memprosesnya –
Edd Dumbill.
Data yang tidak terstruktur atau sensitif waktu atau sangat
besar tidak dapat diproses oleh mesin basis data relasional. Tipe data
ini membutuhkan cara pemrosesan yang berbeda yang menggunakan paralelisme massif
pada hardware yang tersedia.
Big Data sering digambarkan
sebagai 3V (Volume, Variety and Velocity) : volume data yang ekstrem, variasi
tipe data yang luas dan kecepatan dimana data harus diproses. Karakteristik
tersebut diidentifikasi oleh Duog Laney seorang analis industri.
Data yang begitu banyak dapat
berasal dari berbagai sumber, seperti system transaksi bisnis, basis data pelanggan,
catatan medis, log clickstream internet, aplikasi handphone, media sosial,
hasil percobaan ilmiah, data yang dihasilkan oleh mesin, sensor data yang
digunakan IoT. Data dapat dibiarkan dalam bentuk mentah atau diolah menggunakan
data mining tools.
Seperti
yang sudah dijelaskan, Big Data digambarkan sebagai 3V :
- ·Volume : Data
yang besar yang terkumpul dari berbagai sumber , termasuk transaksi bisnis,
media sosial, dll.
- ·Velocity :
kecepatan data yang sangat cepat dimana data yang diterima di proses.
- ·Variety :
Berbagai jenis data yang tersedia , termasuk data terstruktur dalam database
SQL dan Gudang data, data tidak terstruktur seperti file teks dan dokumen yang
tersimpan dalam kelompok Hadoop atau system NoSQL.
0 komentar:
Posting Komentar