Image     Buku Tamu   Humor    Buku Tamu   Site Map

12 Jan 2010

Data Mining secara Umum

Data Mining merupakan teknologi baru yang sangat berguna untuk membantu perusahaan-perusahaan menemukan informasi yang sangat penting dari gudang data mereka. Kakas data mining meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung pengambilan keputusan penting. Analisis yang diotomatisasi yang dilakukan oleh data mining melebihi yang dilakukan oleh sistem pendukung keputusan tradisional yang sudah banyak digunakan.
Data Mining dapat menjawab pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan banyak waktu untuk menjawabnya. Data Mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi pemrediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka.

Definisi Data Mining
Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra).
Data mining dapat juga didefinisikan sebagai “pemodelan dan penemuan polapola yang tersembunyi dengan memanfaatkan data dalam volume yang besar”
1. Data mining menggunakan pendekatan discovery-based dimana pencocokan pola (pattern-matching) dan algoritmaalgoritma yang lain digunakan untuk menentukan relasi-relasi kunci di dalam data yang diekplorasi. Data mining
merupakan komponen baru pada arsitektur sistem pendukung keputusan (DSS) di perusahaan-perusahaan.
Ruang Lingkup Data Mining
Data mining (penambangan data), sesuai dengan namanya, berkonotasi sebagai pencarian informasi bisnis yang berharga dari basis data yang sangat besar. Usaha pencarian yang dilakukan dapat dianalogikan dengan penambangan logam mulia dari lahan sumbernya.
Dengan tersedianya basis data dalam kualitas dan ukuran yang memadai, teknologi data mining memiliki kemampuan-kemampuan sebagai berikut :

  • Mengotomatisasi prediksi tren dan sifat-sifat bisnis. Data mining mengotomatisasi proses pencarian informasi pemprediksi di dalam basis data yang besar. Pertanyaan-pertanyaan yang berkaitan dengan prediksi ini dapat cepat dijawab langsung dari data yang tersedia.
Contoh dari masalah prediksi ini misalnya target pemasaran, peramalan kebangkrutan dan bentukbentuk kerugian lainnya.

  • Mengotomatisasi penemuan polapola yang tidak diketahui sebelumnya. Kakas data mining “menyapu” basis data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu sapuan.
Contoh dari penemuan pola ini adalah analisis pada data penjulan ritel untuk mengidentifikasi produk-produk, yang kelihatannya tidak berkaitan, yang seringkali dibeli secara bersamaan oleh kustomer.
Contoh lain adalah pendeteksian transaksi palsu dengan kartu kredit dan identifikasi adanya data anomali yang dapat diartikan sebagai data salah ketik (karena kesalahan operator).


Cara Kerja Data Mining
Bagaimana tepatnya data mining “menggali” hal-hal penting yang belum diketahui sebelumnya atau memprediksi apa yang akan terjadi? Teknik yang digunakan untuk melaksanakan tugas ini disebut pemodelan. Pemodelan di sini dimaksudkan sebagai kegiatan untuk membangun sebuah model pada situasi yang telah diketahui “jawabannya” dan kemudian menerapkannya pada situasi lain yang akan dicari jawabannya.

Sebagai contoh di sini diambil pencarian solusi bisnis di bidang telekomunikasi3.
Ada beberapa perusahaan telekomunikasi yang beroperasi di sebuah negara dan Gol dari pemodelan ini adalah untuk membuat perkiraan yang didasari kalkulasi untuk mengisi informasi di kuadran kanan bawah.berdasar pada informasi umum dan khusus yang sudah ada (dimiliki oleh perusahaan itu).
Misalnya, sebuah model dimisalkan pihak manajemen sebuah perusahaan bermaksud untuk menjaring kustomer baru untuk jasa layanan sambungan langsung jarak jauh (SLJJ).Pihak manajemen dapat “menghubungi” calon-calon kustomer dengan memilih secara acak kemudian menawari mereka dengan diskon khusus, dengan hasil yang kemungkinan besar kurang menggemberikan, atau dengan memanfaatkan pengalaman-pengalaman bisnis yang saat ini sudah tersimpan di basis data perusahaan untuk membangun sebuah model. Perusahaan ini telah memiliki banyak informasi mengenai kustomer perusahaan tersebut: umur, jenis kelamin, sejarah penggunaan fasilitas kredit dan penggunaan SLJJ.

Juga sudah diketahui informasi mengenai calon-calon kustomer: umur, jenis kelamin, sejarah penggunaan fasilitas kredit, dll. Masalahnya adalah penggunaan SLJJ untuk para calon kustomer ini belum diketahui, karena mereka saat ini menjadi kustomer dari perusahaan lain. Yang dipikirkan pihak manajemen adalah mencari calon kustomer yang akan menggunakan banyak jasa SLJJ. Usaha untuk mencari jawaban masalah ini dilakukan dengan membangun sebuah model.
memberikan ilustrasi mengenai pembangunan model untuk menentukan calon kustomer (prospek) di sebuah gudang data. sederhana untuk perusahaan telekomunikasi itu adalah: 98% kustomer “milik” perusahaan itu yang berpenghasilan $60.000/tahun membelanjakan lebih dari $80/bulan untuk penggunaan SLJJ. Model ini kemudian dapat diterapkan untuk menarik kesimpulan dari informasi khusus (sebagai data prospek), dimana saat ini informasi khusus tersebut tidak dimiliki oleh perusahaan. Dengan model ini, calon-calon kustomer baru dapat ditarget secara selektif.
Skenario lain dalam membangun model adalah: memprediksi apa yang akan terjadi di masa mendatang.

Hubungan Data Mining dan Knowledge Data Discovery (KDD)
Penjelasan umum yang diberikan di atas memberikan pengertian bahwa seolah-olah teknologi data mining adalah teknologi utuh dan berdiri sendiri. Dibandingkan dengan knowledge data discovery (KDD), istilah data mining lebih dikenal para pelaku bisnis. Pada aplikasinya, sebenarnya data mining merupakan bagian dari proses KDD.
Sebagai komponen dalam KDD, data mining terutama berkaitan dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah.

Secara garis besar, langkah-langkah utama dalam proses KDD :
  1. Pemahaman terhadap domain dari aplikasi, relevansinya terhadap pengetahuan yang ada dan goal dari end-user.
  2. Menciptakan himpunan data target: pemilihan himpunan data, atau memfokuskan pada subset variabel atau sampel data, dimana penemuan (discovery) akan dilakukan.
  3. Pemrosesan pendahuluan dan pembersihan data: operasi dasar seperti penghapusan noise dilakukan.
  4. Proyeksi dan pengurangan data: pencarian fitur-fitur yang berguna untuk mempresentasikan data bergantung kepada goal yang ingin dicapai.
  5. Pemilihan tugas data mining: pemilihan goal dari proses KDD misalnya klasifikasi, regresi, clustering, dll.
  6. Pemilihan algoritma data mining untuk pencarian (searching).
  7. Data mining: pencarian pola-pola yang diinginkan di himpunan representasi.
  8. Penterjemahan pola-pola yang dihasilkan dari data mining (langkah 7), kemungkinan dapat kembali langkah 1-7 untuk iterasi lebih lanjut.
  9. Konsolidasi pengetahuan yang ditemukan: pendokumentasian hasil, pencarian penyelesaian apabila ada konflik dengan pengetahuan yang telah dipercaya sebelumnya.

Metodologi Data Mining
Komponen data mining pada proses KDD seringkali merupakan aplikasi iteratif yang berulang dari metodologi data mining tertentu. Pada pembahasan di sini akan digunakan istilah pola dan model.
Pola dapat diartikan sebagai instansiasi dari model. Sebagai contoh f(x) = 3x2 + x adalah pola dari model f(x) = ax2 + bx. Data mining melakukan “pengepasan” atau pencocokan model ke, atau menentukan pola dari data yang diobservasi. Ada dua pendekatan matematis yang digunakan dalam pencocokan model: statistik yang memberikan efek non-deterministik dan logik yang murni deterministik. Yang lebih banyak digunakan adalah pendekatan statistik, mengingat ketidakpastian yang ada dalam proses pembangkitan data di dunia nyata. Kebanyakan metodologi data mining didasarkan pada konsep mesin belajar, pengenalan atau pencocokan pola dan statistik: klasifikasi, pengelompokan (clustering), pemodelan grafis, dll

* Greening D., "Data Mining on the Web: There’s Gold in that Mountain of Data", Web Techniques, Januari 2000,
http://www.webtechniques.com/archives/2000/01/greening/.
* Therling K., "An Introduction to Data Mining: Discovering hidden value in your data warehouse", http://www.thearling.com.
* Fayyad U.M., Piatetsky-Shapiro G., Smyth P., Uthurusamy R., "Advancein Knowledge Discovery and Data Mining", MIT Press, Cambridge MA, 1996.
* Moxon B, "Defining Data Mining", DBMS Online, 1996, http://www.dbmsmag.com/9608d53.html


3 komentar:

  1. sipppppppppppppppp

    BalasHapus
  2. thanks mas shohib...
    kabar di magelang gimana..?

    BalasHapus
  3. Terkait postingan di atas dapat jga di lihat link di bawah ini :

    http://repository.gunadarma.ac.id/bitstream/123456789/2635/1/Ekon-16.pdf

    BalasHapus

Tinggalkan Komentar :