Kali ini judulnya “data warehouse”, aku rasa bagi anak IT, kata2 ini dah populer banget…tp sedikit disini aku mau jelasin dasar2nya “data warehouse”. Tapi tau ga, siapa yang pertama kali mengimplementasikan konsep ini? Kalo yang aku baca sih katanya konsep ini pertama sekali ditemukan oleh ”Bill Inmon” coz dia yang pertama so, dia pun dinobatkan menjadi “Father of the Data Warehouse”…. wow 
And katanya: Meaningnya adalah “sekumpulan or koleksi data yg support pengambilan keputusan pihak manajemen yang punya beberapa karakteristik or ciri-ciri sebagai berikut:“
1. Subject Oriented
Sebuah Data Warehouse dirancang dan dibangun untuk memenuhi kebutuhan analisis data berdasarkan subjek tertentu.
Contohnya: analisis mengenai data penjualan dalam sebuah organisasi bisnis. Semua Informasi tersebut disimpan dalam suatu sistem data warehouse.
2. Integrated
Untuk memenuhi kebutuhan analisis secara menyeluruh, sebuah data warehouse harus mampu mengintegrasikan (menggabungkan) data dari berbagai sumber data yang beragam. So, bisa dibilang yang ini, kita harus bisa mengumpulkan banyak data dan menyatukannya.
3. Non Volatile (Tidak bisa diubah)
Data-data dalam sebuah data warehouse tidak dapat diubah (tidak dapat di-update). Data-data tersebut merupakan data historis yang digunakan untuk memenuhi kebutuhan analisis, bukan untuk menangani transaksi seperti pada basisdata transaksional pada umumnya.
4. Time Variant
Model analisis yang diterapkan pada sebuah data warehouse berfokus pada perubahan data faktual berdasarkan waktu. Dalam hal ini data warehouse harus mampu menyimpan data untuk sebuah subjek tertentu dalam waktu yang berbeda-beda.
Nah itu dia karakterisktik dari data warehouse, but kita juga perlu memperhatikan karakteristik ato ciri-ciri dari sumber data yang akan kita gunakan sebagai “Data warehouse”, why??? Coz, kalo sembarangankan, bisa-bisa jadi ga bisa dianalasis dengan baik nantinya ato datanya jadi ga teratur…
so, that’s why we have to know the characteristics of data source for data warehouse, check this out:
1. Arah sumber data
Ada 2 bagian yaitu:
=> Pemilik sumber mengirim data ke data warehouse
Pemilik data terbebani untuk membuat program baru untuk mengambil data yang diinginkan untuk disimpan di data warehouse, dimana proyek data warehouse mungkin tidak ada hubungan dengan aplikasi yang menjadi sumber data atau bukan prioritasnya.
=> Pengelola data warehouse mengambil data dari sumber
Cara yang kedua ini lebih populer, karena pemilik data pada prinsipnya cukup memberi ijin dan menyetujui kapan pengelola data warehouse boleh mengambil data yang diperlukan.
2. Asal sumber data
Ada 2 juga yaitu:
=> Internal
Ini merupakan sumber data utama untuk data warehouse, biasanya berasal dari aplikasi-aplikasi untuk operasi, transaksi, dan administrasi perusahaan.
=>External
Merupakan data yang bersumber dari luar, misalnya data-data yang berasal dari biro statistik dll
3. Frekuensi
Ada 2 juga, yaitu:
=> Satu kali (one time):
1. Waktu awal/pertama kali mengisi data warehouse, bila sejarah data sebelum tanggal mulai ini perlu/diinginkan disimpan di data warehouse.
2. Untuk recovery, dari backup, bila ada masalah yang mengharuskan data warehouse dihapus seluruh/sebagian datanya dan dikembalikan ke status data sebelum terjadi masalah.
3. Untuk menggabungan data (merge), bila dua atau lebih data warehouse dijadikan satu.
=>Berkala (regular)
sesuai jadwal yang dirancang, untuk menambahkan data baru dan perubahan (incremental update). Beberapa data (tabel database) mungkin lebih efektif/efisien diupdate seluruh datanya (total refresh) daripada incremental.
4. Format
Beberapa format sumber data yang populer (paling sering ditemui) adalah:
File (text, flat); biasanya hasil perubahan data yang nara sumbernya memiliki format bukan relational database. Flat file paling populer karena kesederhanaannya memudahkan pengambilan (extract) dan pengolahannya (transform) dengan kecepatan tinggi. Banyak piranti end-user, terutama OLAP (OnLine Analytical Processing) dan Data Mining, yang menganjurkan input datanya berupa flat file.
Oracle menyediakan utility SQL*Loader untuk mengambil flat file dan menyimpannya di table database. Sejak release 9, disediakan fungsi untuk “melihat” flat file sebagai tabel database (disebut external table)
Relational database; terutama bila database system-nya sama dengan yang digunakan di data warehouse, pengambilan, pengolahan dan penyimpannya ke DW dapat menggunakan teknik dan program yang sama dengan proses ETL yang lain (Extract, Tranform, Load).
ODBC; fasilitas yang “membungkus” sumber data dan formatnya sehingga “dilihat” sebagai tabel database.
5. Keseragaman
Bila data berasal dari berbagai sumber, dengan struktur dan nama-nama field yang berbeda, juga kadang mengandung makna berbeda, mereka perlu diseragamkan sebelum disimpan terintegrasi ke data warehouse tidaklah sederhana. Selain kompleksitas teknis, proses penyeragaman membutuhkan persetujuan bersama seluruh komunitas end-user.
6. Kebersihan
Menjaga kualitas sumber data merupakan proses dan tanggung jawab paling penting dan rumit perancangannya dalam membangun DW. Idealnya, semua data yang tersimpan di data warehouse harus bersih, untuk menjamin kepercayaanya bagi end-user, terutama bila data di data warehouse menjadi dasar pengambilankeputusan para pimpinan.
Nah…sekian dulu penjelasan dari aku about data warehouse….moga berguna…