Konten :
Apa itu Data Warehouse?
Data Warehouse adalah database relasional yang dirancang untuk permintaan dan analisis daripada pemrosesan transaksi. Ini termasuk data historis yang berasal dari data transaksi yang berasal dari sumber tunggal dan ganda.
Data Warehouse menyediakan data historis yang terintegrasi di seluruh perusahaan dan berfokus pada penyediaan dukungan bagi pengambil keputusan untuk pemodelan dan analisis data.
Data Warehouse merupakan sekelompok data khusus untuk seluruh organisasi, tidak hanya untuk kelompok pengguna tertentu.
Ini tidak digunakan untuk operasi sehari-hari dan pemrosesan transaksi tetapi digunakan untuk membuat keputusan.
Data Warehouse dapat dilihat sebagai sistem data dengan atribut berikut:
- Database yang dirancang untuk tugas investigasi, menggunakan data dari berbagai aplikasi.
- Mendukung sejumlah kecil klien dengan interaksi yang relatif lama.
- Data real-time dan historis untuk memberikan perspektif informasi bersifat historikal.
“Data Warehouse adalah penyimpanan informasi yang berorientasi pada subjek, terintegrasi, dan bervariasi waktu untuk mendukung keputusan manajemen.”
Karakteristik Data Warehouse
Subjektif
Target data warehouse pada pemodelan dan analisis data untuk pengambil keputusan. Oleh karena itu, data warehouse biasanya memberikan pandangan yang ringkas seputar subjek tertentu, seperti pelanggan, produk, atau penjualan, alih-alih operasi berkelanjutan organisasi global. Hal ini dilakukan dengan mengecualikan data yang tidak berguna tentang subjek dan memasukkan semua data yang dibutuhkan oleh pengguna untuk memahami subjek.
Integrasi
Suatu data warehouse mengintegrasikan berbagai sumber data heterogen seperti RDBMS, file datar, dan catatan transaksi online. Ini membutuhkan pembersihan dan integrasi data selama penyimpanan data untuk memastikan konsistensi dalam konvensi penamaan, tipe atribut, dan lain-lain di antara sumber data yang berbeda.
Variasi Waktu
Informasi historis disimpan di data warehouse. Misalnya, seseorang dapat mengambil file dari 3 bulan, 6 bulan, 12 bulan, atau bahkan data sebelumnya dari data warehouse. Variasi ini dengan sistem transaksi, di mana seringkali hanya file terbaru yang disimpan.
Non-Volatile
Data warehouse adalah penyimpanan data yang terpisah secara fisik, yang diubah dari RDBMS. Pembaruan operasional data tidak terjadi di data warehouse, yaitu operasi pembaruan, penyisipan, dan penghapusan tidak dilakukan.
Biasanya hanya membutuhkan dua prosedur dalam mengakses data: Pemuatan awal data dan akses ke data. Oleh karena itu, DW tidak memerlukan pemrosesan transaksi, pemulihan, dan kemampuan konkurensi, yang memungkinkan untuk mempercepat pengambilan data secara substansial. Non-Volatile mendefinisikan bahwa sekali masuk ke warehouse, dan data tidak boleh berubah.
Jenis Data Warehouse
Dengan kemajuan teknologi, serta inovasi dalam penggunaan teknik data warehousing, data warehouse telah berubah dari Offline Operational Database menjadi Online Integrated data warehouse.
- Operasional Offline Data Warehouse merupakan tempat penyimpanan data yang biasanya disalin dan ditempelkan dari jaringan data waktu nyata ke dalam sistem offline yang dapat digunakan. Biasanya tipe data warehouse yang paling sederhana dan kurang teknis.
- Offline Data Warehouse merupakan jenis data warehouse yang sering diperbarui (harian, mingguan, atau bulanan). Data disimpan dalam struktur terintegrasi di mana orang lain dapat mengaksesnya dan melakukan pelaporan.
- Time Series Data Warehouse adalah jenis data warehouse yang diperbarui setiap saat dengan masuknya data baru.
- Integrated Data Warehouse adalah jenis data warehouse yang dapat digunakan oleh sistem lain untuk mengaksesnya untuk sistem operasional. Beberapa Data Warehouse yang lainnya menggunakan jenis ini, memungkinkan mereka mengaksesnya untuk memproses laporan, serta pencarian data.
Plus-Minus Data Warehouse
Salah satu alasan untuk penerapan data warehouse adalah agar karyawan atau pengguna dapat mengakses data warehouse dan menggunakan data untuk laporan, analisis, dan pengambilan keputusan. Menggunakan data di warehouse dapat membantu menemukan tren/pola, fokus pada hubungan maupun korelasi, dan membantu pengguna lebih memahami lingkungan tempat bisnis beroperasi.
Baca juga : Apa Itu Piramida Data ?
Data Warehouse juga dapat meningkatkan konsistensi data dan memungkinkannya untuk diperiksa berulang kali untuk menentukan seberapa relevan data tersebut. Karena sebagian besar integrated data warehouse, pengguna dapat menarik data dari berbagai bidang bisnis mereka, misalnya sumber daya manusia, keuangan, IT, akuntansi, dll.
Meskipun ada banyak alasan untuk memiliki data warehouse, perlu diketahui bahwa ada beberapa hal negatif yang terkait dengan ini. Ini termasuk fakta bahwa itu memakan waktu untuk membuat dan untuk tetap beroperasi.
Pengguna mungkin juga memiliki masalah dengan sistem saat ini yang tidak kompatibel dengan data. Penting juga untuk mempertimbangkan peningkatan peralatan dan perangkat lunak di masa mendatang. Ini mungkin juga harus kompatibel dengan data.
Akhirnya, keamanan mungkin menjadi perhatian besar, terutama jika data dapat diakses melalui jaringan terbuka seperti Internet. Pengguna tidak ingin pesaing mereka melihat, meretas, atau menghancurkan data mereka.
Kebutuhan Data Warehouse
Data Warehouse diperlukan karena alasan berikut:
- Bisnis : Pengguna bisnis dan pemegang saham memerlukan data warehouse untuk melihat ringkasan data secara historis. Pada umumnya, orang-orang di sektor bisnis bersifat non-teknis, sehingga data dapat disajikan kepada mereka dalam bentuk dasar.
- Menyimpan data historis: Data Warehouse diperlukan untuk menyimpan data variabel waktu dari masa lalu. Masukan ini dibuat agar dapat digunakan untuk berbagai keperluan.
- Membuat keputusan strategis: Beberapa strategi mungkin bergantung pada data di warehouse. Jadi, data warehouse berkontribusi untuk membuat keputusan strategis.
- Untuk konsistensi dan kualitas data: Membawa data dari sumber yang berbeda di tempat yang biasa, pengguna dapat secara efektif melakukan untuk membawa keseragaman dan konsistensi dalam data.
- Waktu respons yang tinggi: Data Warehouse harus siap untuk beban dan jenis query yang agak tidak terduga, yang menuntut tingkat fleksibilitas yang signifikan dan waktu respons yang cepat.
Manfaat Data Warehouse
- Pahami tren bisnis dan buat keputusan perkiraan yang lebih baik.
- Data Warehouse dirancang untuk melakukan sejumlah besar data dengan baik.
- Struktur data warehouse lebih mudah diakses oleh pengguna akhir untuk menavigasi, memahami, dan melakukan query.
- Query yang kompleks di banyak database yang dinormalisasi bisa lebih mudah dibangun dan dipelihara di warehouse data tersebut.
- Data warehousing merupakan metode yang efisien untuk mengelola permintaan banyak informasi dari banyak pengguna.
- Data warehousing menyediakan kemampuan untuk menganalisis sejumlah besar data historis.