23.4.11

Lanjutan Data Warehouse

1. Permodelan Data Warehouse

Kebutuhan organisasi akan data sangat besar, tetapi sering tidak mempunyai kemampuan untuk memprosesnya.. Hal tersebut sama halnya dengan otak kanan yang bertugas untuk menangkap dan menyimpan data dalam volume yang besar, sementara otak kiri tidak tahu bagaimana memakainya J. Kemampuan manajer untuk menganalisis data yang sangat besar tersebut sangat terbatas sehingga perlu dilakukan pengaturan tertentu sehingga lebih mudah untuk dianalisis.

Intinya adalah volume data tidak relevan jika tidak diorganisasikan, dengan mengorganisasikan data kita memperoleh nilai tambah dari data tersebut. Padahal, nilai bagi sebuah organisasi berarti bagaimana mengubah data menjadi informasi untuk mengambil keputusan.

Datawarehouse mendukung kemampuan melakukan query untuk mendukung pengambilan keputusan, data warehouse lebih mudah dipahami oleh customer dilihat kebutuhan informasi mereka dalam menaksir keadaan finansial, produk dan layanan, serta waktu untuk memasarkan produk dan layanan baru. Yang terpenting – mungkin juga harapan yang berersiko – data warehousing dapat dilihat sebagai teknologi, dengan kemampuan unik untuk mengolah informasi, bertujuan untuk menghasilkan pendapatan yang tinggi dan memperbesar keuntungan.

Multidimensional modeling (MDM) untuk memodelkan datawarehouse

Multidimensional modeling (MDM) adalah salah satu pendekatan untuk memberi arti (atau warehousing) pada gunungan data tersebut. MDM tidak terikat pada representasi fisik dari data. Dapat dipisahkan dari multidimensional database, Tidak terlalu sulit untuk dimengerti atau dipraktekan serta bukan mode yang terbaru atau terakhir

MDM adalah teknik untuk memodelkan bisnis secara konseptual sebagai sekumpulan ukuran yang dijabarkan oleh segi bisnis secara umum. Sangat berguna untuk pergantian, peringkasan dan penyusunan data untuk analisis. Sangat kontras dengan online trasaction processing (OLTP) System, yang didesain sekitar entitas, relationship, functional decomposition, dan state transition analysis, MDM untuk data warehousing berdasarkan fakta, dimensi, hirarki dan sparsity.

MDM didesain untuk data numerik, seperti nilai, jumlah, berat, dan kejadian, dalam OLTP permasalahan adalah “Bagaimana membuat model yang memenuhi proses transaksi”, dalam MDM permasalahan adalah “ Apa keuntungan bagi saya dengan pelanggan, dengan organisasi?”

Bagian yang menarik dari MDM adalah kesederhanaanya. Desain OLTP boleh jadi mimiliki selusin atau bahkan ribuan tabel, yang menyebabkan kesulitan bagi manajer untuk memahami desain data dalam rangka menganalisis data. MDM lebih sederhana, model tidak hanya dimengerti oleh orang bisnis, tetapi juga diexpresikan dengan cara yang natural oleh user. Desain konseptual MDM yang baik, dapat diimplementasikan dalam database relasional, multidimensional, bahkan object-oriented database.

MDM didesain untuk menunjang pelaporan dan kebutuhan analisis. Dapat dijelaskan dengan membedakannya dengan model relasional dalam beberapa hal:

MDM melihat informasi dari prespektif “potongan waktu” bahkan transaksi atomik. Sistem OLTP merekam kejadian diskrit dari transaksi. Contohnya isian jurnal, pesanan pembelian, billing,dll. MDM tidak mempedulikan actual event, hanya hasil kuantitatif pada suatu interval waktu, seperti hari, minggu atau bulan.

Enam pertanyaan mendasar

Tahap awal untuk membangun model multidimensional adalah mengambil subjek area tentang laporan penjualan mingguan, keadaan finansial bulanan, biaya klaim asuransi yang dimodelkan dengan enam pertanyaan mendasar:

1. Proses bisnis apa yang sedang dimodelkan

2. Ukuran atau fakta-fakta apa yang digunakan

3. Seberapa detil dari kegiatan analisis dilakukan

4. Dimensi dari ukuran secara umum

5. Apa atribut-atribut dari dimensi

6. Apakah atribut-atribut tersebut tetap atau berubah terhadap waktu

Masadepan data warehousing

Dalam penerapan data warehousing perlu diperhatikan komponen organisasi yang paling penting – sumber daya manusia – apa yang akan terjadi pada pekerjaan-pekerjaan mereka jika datawarehose dimanuka kedalam budaya organisasi. Dalam membangun aplikasi data warehouse perlu diperhatikan apakah aplikasi yang dibuat tersebut sanggup memenuhi objektif dari bisnis mereka.

Perkembangan jaringan komputer memungkinkan adanya sistem basis data tesebar, Internet yang semakin global menjadi tulang punggun dari perusahaan, teknologi media penyimpanan yang berkapasitas besar serta makin cepat dan murah, serta perkembangan platform baru akan mewarnai masa depan dari data warehousing.

kesimpulan

· Data warehouse sangat dekat dengan pengambilan keputusan dan masuk dalam sistem penunjang pengambilan keputusan (decession support system -- DSS)

· Data warehouse memberikan kemudahan bagi manajer untuk menganalisis data operasional yang sangat besar dalam rangka pengambilan keputusan

· Multidimensional modeling (MDM) adalah salah satu cara untuk memodelkan datawarehouse

· Internet, teknologi media penyimpanan, dan platform baru akan merubah masa depan dari data warehousing.

Ringkasan Data Warehouse

Data warehouse adalah kumpulan data dari berbagai sumber yang ditempatkan menjadi satu dalam tempat penyimpanan berukuran besar lalu diproses menjadi bentuk penyimpanan multidimensional dan didesain untuk querying dan reporting. Menurut Bill Inmon, data yang disimpan didalam data warehouse ini memiliki empat karakteristik, yaitu :

1. Subject oriented, data yang disimpan disesuaikan dengan proses bisnisnya

2. Integrated, semua data diintegrasikan kedalam satu media penyimpanan, dalam hal ini adalah database yang sangat besar, dimana formatnya diseragamkan,

3. Time variant, data yang disimpan bersifat historical, dan

4. Non-volatile, data cenderung tidak berubah.

Komponen Utama Data Warehouse

Tiga komponen utama Data Warehouse yaitu :

1. Data staging area Dalam tahap ini, data diolah dari sumbernya untuk siap menjawab query. Prosesnya terdiri dari extract,transform,load (ETL).

2. Data presentation area Dalam tahap ini, data diorganisasikan, disimpan dan dapat menjamin ketersediaannya akan segala kebutuhan query. Selain itu disini dilakukan juga penulisan laporan dan kebutuhan aplikasi untuk analisis selanjutnya.

3. Data access tools Penyediaan interface untuk penggunaan aplikasi untuk query data

Komponen utama Data Warehouse.JPG

Distributed Data Warehouse

Distributed data warehouse merupakan kumpulan data store yang dibangun secara terpisah yang digabungkan secara fisik melalui jaringan. Tujuannya adalah agar komponen-komponen yang terpisah ini terlihat sebagai satu kesatuan utuh sebuah sistem data warehouse . Suatu enterprise data warehouse dapat dibentuk dari kumpulan data mart yang terpisah, jadi tidak selalu membentuk sistem yang terpusat tetapi juga bisa terdistribusi. Dengan kecenderungan data-oriented, data pada suatu perusahaan atau organisasi seharusnya merupakan data yang widely-shareable. Tipe-tipe distributed data warehouse :

1. Dengan local dan global data warehouse

Local Data Warehouse merepresentasikan data dan proses-proses pada remote site. Sedangkan global Data Warehouse merepresentasikan bagian dari bisnis yang diintegrasikan.

2. Technologically Distributed Data Warehouse

Menunjukkan bahwa secara logic, ini merupakan single dw tapi pada kenyataannya secara fisik terdapat beberapa dw yang diintegrasikan yang berasal dari beberapa prosesor/site yang berbeda.

3. Independently evolving Distributed Data Warehouse

Setiap bagian dari distributed data warehouse, memiliki otonomi untuk mengatur dan mengembangkan bisnisnya tanpa harus memperhatikan bagian yang lain.

Arsitektur Distributed Data Warehouse

Distributed data warehouse terbentuk dari beberapa data mart yang diintegrasikan. Setiap data mart ini memiliki skema ETL yang terpisah, bisa jadi satu data mart dengan data mart lainnya berbeda, tetapi tidak menutup kemungkinkan dimana skema ETLnya sama, tergantung proses bisnis yang terjadi didalamnya. Disini kita mengenal local data warehouse dan global data warehouse. Dalam beberapa kasus, bagian data warehouse bisa berada di lingkungan terpusat (global) sekaligus terdistribusi (local). Contohnya, suatu perusahaan yang besar yang memiliki cabang yang tersebar di beberapa kota. Mereka membutuhkan global data warehouse sebagai tempat informasi yang dikumpulkan. Sedangkan local data warehouse diperlukan untuk menangani masalah bisnis yang terjadi ditiap cabangnya. Sehingga dapat dikatakan bahwa distributed data warehouse ini memberikan otonomi kepada tiap local areanya untuk menjawab persoalan bisnisnya sendiri. Setiap local data warehouse, dalam hal ini data mart, dapat melakukan pekerjaannya dengan implementasi sendiri tanpa mengetahui apa yang sedang dilakukan data meart lainnya. Dalam distributed data warehouse ini, share informasi hanya dilakukan oleh local data warehouse dengan global data warehouse. Jadi tidak terjadi pertukaran informasi antar local data warehouse. Akan tetapi, disini semua data mart harus didesain untuk bekerja secara bersamaan menjadi satu warehouse yang utuh.

TABEL: Perbandingan antara Data Warehouse dan OLAP

Data Warehouse

OLTP

  • Lebih cendrung menangani data masa lalu
  • Data disimpan dalam satu macam platform
  • Melayani permintaan insidentil, tak berstruktur, dan bersifat heuristik
  • Mendukung pengambilan keputusan strategis
  • Data diorganisasi menurut subjek, misalnya menurut produk, supplier
  • Ber-orientasi pada analisis
  • Dapat mendukung kelompok manajerial yang berjumlah sedikit
  • Menangani data masa kini
  • Data bisa saja tersimpan dalam berbagai platform
  • Melayani permintaan yang periodik atau berulang
  • Mendukung pengambilan keputusan operasional (sehari-hari)
  • Data diorganisasi menurut fungsi, misalnya menurut penjualan atau menurut produksi
  • Ber-orientasi pada transaksi
  • Mendukung kelompok kerja operasional, berjumlah banyak

Sumber data dari Data Warehouse adalah data operasional dalam suatu organisasi seperti data pelanggan, data produk, dsb, kemudian ditambah dengan data eksternal misalnya dari Internet seperti data pemasok, dan data komersial lainnya.

Data Warehouse bersifat multidimensional, lebih dari dua dimensi, sementara tabel relasional untuk OLAP hanya berdimensi dua. Sebagai contoh berikut ini adalah tayangan data tiga dimensi dari data pembelian barang selama beberapa tahun.

GAMBAR: Gambaran Data Tiga Dimensi

GAMBAR: Gambaran Data Tiga Dimensi

Berdasarkan susunan data dimensional seperti diatas, analisis data dapat dilakukan misalnya untuk menjawab pertanyaan : “Berapa jumlah barang-1 yang disalurkan oleh pemasok-2 antara tahun (n-3) sampai dengan tahun (n-1)?”. Persoalan utama yang mungkin dihadapi adalah volume data warehouse tentu sangat besar sehingga diperlukan teknologi pemrosesan paralel seperti Symmetric Multi Processor (SMP) atau Massively Parallel Processor(MPP).

Data Warehouse dapat dibangun menggunakan program aplikasi yang dirancang sendiri, tetapi tersedia beberapa perangkat lunak yang dipasarkan khusus untuk membangun data warehouse pada suatu organisasi, antara lain:

  • SourcePoint (Software AG)
  • HP Intelligent Warehouse (Hewlett Packard)
  • FlowMark (IBM)

Laudon dan Laudon (1998) dalam bukunya menuliskan beberapa langkah untuk membangun data warehouse organisasi, yaitu:

1. Menentukan misi dan sasaran bisnis yang akan dicapai dengan membangun data warehouse.

2. Melakukan identifikasi komponen data yang diperlukan dari basisdata operasional untuk membangun data warehouse.

3. Merancang struktur basis data untuk data warehouse.

4. Membangun kebijakan dalam mengarsipkan data lama sehingga ruang penyimpanan bisa diatur sedemikian rupa agar eksekusi program analisa data tidak terlalu lamban.

5. Mentransfer data operasional secara periodik ke dalam basis data warehouse.

Selain data warehouse dikenal pula istilah data mart yang tidak merupakan bagian dari data warehouse untuk melayani kebutuhan organisasi dalam lingkup yang lebih sempit, misalnya kebutuhan bagian atau departemen tertentu dalam organisasi. Perbedaan antara data warehouse dan data mart antara lain:

  • Data mart difokuskan untuk keperluan pemakai yang terkait dalam sebuah departemen atau suatu fungsi bisnis.
  • Data mart biasanya mengandung data operasional yang tidak terlalu rinci seperti pada data warehouse.
  • Data mart umumnya mengandung informasi yang lebih sedikit dibanding dengan data warehouse.

Beberapa contoh produk data mart adalah sebagai berikut:

  • SmartMart (IBM)
  • Visual Warehouse (IBM)
  • PowerMart (Informatica)

3.26 Copyright (C) 2008 Compojoom.com / Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved."

No comments: