Image     Buku Tamu   Humor    Buku Tamu   Site Map

10 Mar 2011

Fuzzy Clusterring

Pengelompokkan (klasterisasi) bisa diselesaikan secara fuzzy dan non fuzzy. Pada fuzzy klasterisasi hasil matriks transformasinya berupa nilai derajat keanggotaan antara 0 dan 1, sedangkan pada non fuzzy nilainya 0 dan 1. Proses klasterisasi pada dasarnya merupakan proses pembuatan gugus atau himpunan yang memiliki anggota elemen-elemen yang akan diklaster. Pengelompokkan dikatakan fuzzy jika tiap-tiap objek  dihubungkan dengan menggunakan derajat keanggotaan (bukan dengan keanggotaan crisp). (Kusumadewi, 2002).

Bila dalam pengelompokkan konvensional, sebuah poin data keanggotaannya hanya pada satu kelompok saja, namun dalam fuzzy klasterisasi, sebuah poin data bisa menjadi anggota dalam banyak kelompok tapi tentunya dengan derajat keanggotaan berbeda-beda. Derajat keanggotaan adalah ukuran seberapa kuat sebuah poin data menjadi bagian dalam klaster. Ukuran ini penting dalam proses pembuatan aturan. ( Cox, 2005).
Keanggotaan dalam sebuah klasterisasi jelas Cox (2005) merupakan ukuran jarak dari sebuah pusat klaster ke data point. Gambar 4 di bawah ini menggambarkan jarak sebuah data point (pj) terhadap satu pusat klaster (c).

[gambar fuzzy clusterring]

Dalam fuzzy klasterisasi keanggotaan sebuah data poin tidak hanya terhadap satu kelompok tapi juga ke beberapa kelompok. Hal ini merupakan keistimewaan pengelompokkan menggunakan fuzzy klasterisasi dibandingkan dengan pengelompokkan tradisional. Gambar 5 berikut ini akan menggambarkan keanggotaan sebuah point data pj (dalam hal ini dinyatakan dalam jarak) pada dua klaster yakni klaster pertama (c1) dan klaster kedua (c2).

[gambar fuzzy clusterring 2]

Menurut Han dan Kamber (2001) dan Pedrycz (2005) kesamaan dan ketidaksamaan antara dua objek bisa digambarkan sebagai jarak. Jarak menurut Santosa (2007) merupakan aspek penting dalam pengembangan metode pengklasifikasian maupun regresi. Ukuran jarak menurut Han dan Kamber (2001), Pedrycz (2005) dan Santosa (2007) harus memenuhi syarat-syarat sebagai berikut:
1. d (i, j) ≥ 0 ;
Jarak adalah sebuah angka non negatif. Tidak ada jarak yang mempunyai nilai
negatif.
2. d (i, j) = 0 ;
 Jarak dari objek terhadap dirinya sendiri yakni jarak antara suatu objek atau titik
dengan objek atau titik itu sendiri adalah nol.
3. d (i, j) = d (j, i) ;
Jarak adalah sebuah fungsi simetrik. Jarak dari i ke j adalah sama dengan jarak
dari j ke i.
4. d (i, j) ≤ d (i, h) + d (h, j) ;

Jika diatur dari objek i ke objek j dalam ruang yang sama tidak lebih dari pembuatan cara lain pada objek h yang lain (triangular inequality).
Salah satu pengukuran jarak yang cukup populer di dalam Han dan Kamber (2001), Pedrycz (2005) dan Santosa (2007) adalah pengukuran jarak euclidean. Pengukuran jarak euclidean akan dihitung berdasarkan persamaan 2 berikut ini :
[gambar fcm3 ]

dimana titik pusat klaster ke-i = (xi1,xi2,...,xik) dan titik int data ke-j = (xj1, xj2,...,xjn) dengan jumlah klaster k serta jumlah data n.

Menurut Pedrycz (2005) dan Cox (2005) ada beberapa pendekatan yang digunakan dalam melakukan klasterisasi. Salah satuny partitional membangun sebuah partisi dari sebuah basisdata D dengan n
objek ke dalam himpunan k klaster. Pada fuzzy c-mean, partisi dilakukan dengan membagi data menjadi dua atau lebih klaster.

Tujuan dari analisis klaster menurut Kusumadewi (2002), Cox (2005) dan Pedrycz (2005) adalah untuk mengenali dan fikasi ada dua proses yakni identifikasi keanggotaan sebuah point data dalam beberapa grup dan meletakkan pusat klaster (centroid). Membangun pusat klaster dilakukan lewat proses iterasi dimana setiap iterasi dilakukan perbaikan hingga konvergen.

Dalam pemanfaatannya algoritma klasterisasi tidak hanya digunakan untuk mengorganisasi da
kan kompresi dan mengkonstruksi model data. Caranya, algoritma
klasterisasi membagi-bagi sebuah set data ke dalam beberapa grup berdasarkan
kemiripannya ke dalam satu grup atau lebih (Jang et al, 1997).

Teknik klasterisasi juga digunakan untuk menghubungkan jaringan basis fungsi radial atau dasar model fuzzy dalam menandai lokasi u atau aturan fuzzy if-then. Untuk hal ini teknik klasterisasi melakukan
validasi pada basis berdasarkan asumsi :
  1. Kemiripan input untuk sistem target menjadi model dan menghasilkan output
    yang mirip.
  2. Pasangan input-output disatukan dalam klaster di dalam set data training.

Selain hal di atas, teknik klasterisasi juga bisa digunakan untuk mengidentifikasi struktur di dalam model neural atau fuzzy yang lebih heuristic Jang et al, 1997).

Tidak ada komentar:

Posting Komentar

Tinggalkan Komentar :