Cara Analisis Cluster Metode Hirarkis dengan SPSS

| Portal-Statistk | Malam minggu yang dibaluti dengan rintis hujan menambah kenikmatan untuk minum secangkir kopi hangat sambil nonton bola, hehe. Chelsea tadi menang soalnya jadinya agak semangat nih postingnya.
Youk Langsung disimak saja. Selamat Menikmati.

Mengenal Lebih Dekat Analisis Cluster
Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat  kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi.

Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi set vaiabel secara empiris sebaliknya menggunakan setvariabel yang ditentukan oleh peneliti itu sendiri. Fokus dari analisis cluster adalah membandingkan objek berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan set variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah suatu set variabel yang merepresentasikan karakteristik yang dipakai objek-objek. Bedanya dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokan objek sedangkan analisis faktor terfokus pada kelompok variabel.

Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi cluster secara keseluruhan bergantung pada variabel-variaabel yang digunakan sebagai dasar untuk menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang relevan dapat mempengaruhi substansi hasi analisisi cluster.

Cara Kerja Analisis Cluster
Secara garis besar ada tiga hal yang harus terjawab dalam proses kerja analisis cluster, yaitu :
  1. Bagaimana mengukur kesamaan ?
    Ada tiga ukuran untuk mengukur kesamaaan antar objek, yaitu ukuran korelasi, ukuran jarak, dan ukuran asosiasi.
  2. Bagaimana membentuk cluster ?
    Prosedur yang diterapkan harus dapat mengelompokkan objek-objek yang memiliki kesamaan yang tinggi ke dalam sutau cluster yang sama.
  3. Berapa banyak cluster/kelompok yang akan dibentuk ?
    Pada prinsipnya jika jumlah cluster berkurang maka homogenitas alam cluster secra otomatis akan menurun.
Tujuan dari Analisis Cluster adalah mengelompokkan obyek berdasarkan kesamaan karakteristik di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu cluster yang baik yaitu mepunyai :
  • Homogenitas internal (within cluster); yaitukesamaan antar anggota dalam satu cluster.
  • Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu dengan clusteryang lain.
Langkah pengelompokan dalam analisis cluster mencakup 3 hal berikut :
  1. Mengukur kesamaan jarak
  2. Membentuk cluster secara hirarkis
  3. Menentukan jumlah cluster.
Adapun metode pengelompokan dalam analisis cluster meliputi :
  • Metode Hirarkis : memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan seterusnya hingga cluster akan membentuk semacam ‘pohon’ dimana terdapat tingkatan (hirarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling tidak mirip. Alat yang membantu untuk memperjelas proses hirarki ini disebut “dendogram”.
  • Metode Non-Hirarkis : dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut “K-Means Cluster”.
Asumsi yang harus dipenuhi dalam Analisis Cluster yaitu :
  • Sampel yang diambil benar-benar dapat mewakili populasi yang ada (representativeness of the sample)
  • Multikolinieritas.
Dalam tulisan ini akan dibahas bagaimana melakukan analisis cluster dengan menggunakan metode hirarkis sesuai penjelasan diatas. Konsep dari metode hirarkis ini dimulai dengan menggabungkan 2 obyek yang paling mirip, kemudian gabungan 2 obyek tersebut akan bergabung lagi dengan satu atau lebih obyek yang paling mirip lainnya. Proses clustering ini pada akhirnya akan ‘menggumpal’ menjadi satu cluster besar yang mencakup semua obyek. Metode ini disebut juga sebagai “metode aglomerativ” yang digambarkan dengan dendogram.

Untuk lebih memahaminya silahkan diperhatikan Studi Kasus dibawah ini:
Dari penelitian yang dilakukan terhadap 12 kota, ingin diketahui pengelompokan kota-kota tersebut berdasarkan instrumen 5 variabel yaitu :
  • jumlah pendapatan kota (trilyun Rp)
  • jumlah pinjaman pemerintah kota (milyar Rp)
  • jumlah dana hibah yang dimiliki kota (milyar Rp)
  • jumlah konsumsi pemerintah kota (milyar Rp)
  • jumlah penduduk kota (juta jiwa).
Untuk itu data yang berhasil dikumpulkan sebagai berikut:

kotapendapatanpinjamandn. Hibahkonsumsipenduduk
A555.695025
B61876241
C583.976032
D675.576451
E715.767042
F767.688029
G818.798057
H567.168629
I847.678246
J886.588652
K846.898861
L90899066

Untuk menyelesaikan studi kasus tersebut ada beberapa langkah yang harus dilakukan.

  1. Buka Aplikasi SPSS, setelah itu buat variabel dan tipe datanya, contohnya seperti gambar dibawah ini.
  2. Lakukan entri data sesuai dengan studi kasus diatas.
  3. Lakukan Transformasi atau Standarisasi data tersebut. Klik menu Analyze - Descriptives Statistics - Descriptives. Masukkan seluruh variabel instrumen penilai, yaitu variabel jumlah pendapatan, jumlah pinjaman, jumlah dana hibah, jumlah konsumsi, dan jumlah penduduk. (dalam hal ini variabel kota tidak dimasukkan karena data bertipe string). Kemudian berikan centang pada “Save standardized values asvariables”. Kemudian klik OK.
  4. Sehingga muncul output deskritif statistik. Kemudian pada data view akan terlihat juga hasil dari perhitungan z-score dan hasil z-score inilah yang akan dipakai sebagai dasar analisis cluster. Namun apabila data yang terkumpul tidak mempunyai variabilitas satuan, maka proses analisis cluster dapat langsung dilakukan tanpa terlebih dahulu melakukan transformasi atau standardisasi.
  5. Selanjutnya, Klik menu Analyze – Classify - Hierarchical Cluster… Kemudian masukkan seluruh variabel yang telah distandardkan tadi (Z-score) ke dalam kotak Variable(s). Pada bagian Label Cases by isi dengan variabel kota sedangkan untuk bagian Cluster pilih Cases; pada bagian Display pilih keduanya yaitu Statistics dan Plots.
  6. Kemudian klik button Statistics, berikan centang pada Agglomeration Schedule dan Proximity matrix. Untuk menampilkan jarak antar variabel, pada bagian Cluster Membership klik mouse pada pilihan Range of Solutions lalu isi dengan 2 pada FROM dan 4 pada THROUGH (berarti nantinya akan ditampilhan susunan 2, 3, dan 4 cluster). Kemudian tekan tombol Continue untuk kembali ke menu utama.
  7. Kemudian klik button Plots. Aktifkan pilihan Dendogram; kemudian pada bagian Icicle pilih None. Selanjutnua klik Continue untuk kembali ke menu utama.
  8. Kemudian klik button Method… Pada bagian Cluster Method pilih Between groups linkage. Pada Measure pilih Square Euclidean distance  dan pada Transform Values pilih Z-score. Lalu tekan tombol Continue untuk kembali ke menu utama. Dari tampilan menu utama, tekan tombol OK.
Selanjutnya, perhatikan output berikut ini.

Tabel output di atas menunjukkan bahwa semua data sejumlah 12 obyek telah diproses tanpa ada data yang hilang.
Tabel diatas menujukkan matrik jarak antara variabel satu dengan variabel yang lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut sehingga akan membentuk kelompok (cluster).
Tabel di atas merupakan hasil proses clustering dengan metode Between Group Linkage. Setelah jarak anatar varaiebl diukur dengan jarak euclidean, maka dilakukan pengelompokan, yang dilakukan secara bertingkat.
  • Stage 1 : terbentuk 1 cluster yang beranggotakan Kota K dan Kota L dengan jarak 1,139 (perhatikan pada kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 12 obyek yang ada. Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 4. Hal ini berarti clustering selanjutnya dilakukan dengan melihat stage 4, dengan penjelasan berikut.
  • Baris ke-4 (stage 4) terlihat obyek ke-7 (Kota G) membentuk cluster dengan Kota K. Dengan demikian, sekarang cluster terdiri dari 3 obyek yaitu Kota G, K, dan L. Sedangkan jarak sebesar 2,097 merupakan jarak rata-rata obyek terakhir yang bergabing dengan 2 obyek sebelumnya, seperti tampak dalam Proximity matrix dan dapat dihitung sebagai berikut :
    Jarak Kota G dan K = 2,432
    Jarak Kota G dan L = 1,761
    Jarak rata-rata = (2,432 + 1,761) / 2 = 2,0965
  • Stage 2 : terjadi pembentukan cluster Kota D dan Kota E berjarak 1,515), yang kemudian berlanjut ke stage 6.
  • Demikian seterusnya dari stage 3 dilanjutkan ke stage 5, sampai ke stage terakhir.

Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah cluster yang dibentuk. Perincian jumlah cluster dengan anggota yang terbentuk dapat dilihat pada tabel output berikut ini :
Dari tabel diatas dapat dijabarkan bahwa :
  • Apabila diinginkan dibentuk 4 cluster, maka :
    Anggota cluster 1 adalah Kota A
    Anggota cluster 2 adalah Kota B dan Kota H
    Anggota cluster 3 adalah C, D, dan E
    Anggota cluster 4 adalah Kota F, G, I, J, K, dan L.
  • Apabila ditentukan dibentuk 3 cluster, maka :
    Anggota cluster 1 adalah Kota A
    Anggota cluster 2 adalah Kota B, C, D, E, dan H.
    Anggota cluster 3 adalah Kota F, G, I, J, K, dan L.
  • Apabila ditentukan dibentuk 2 cluster, maka :
    Anggota cluster 1 adalah Kota A, B, C, D, E, dan H
    Anggota cluster 2 adalah Kota F, G, I, J, K, dan L.

Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan Kota K sampai dengan Kota F (sesuai urutan dalam dendogram); dan cluster2 beranggotakan Kota D sampai dengan Kota A. Demikian seterusnya dapat dengan mudah dilihat anggota tiap cluster sesuai jumlah cluster yang diinginkan.

Demikian postingan kali ini, ane udah ngantuk gan, mau tidur dulu :D
Semoga bermanfaat
Have FUN.
15 Komentar untuk "Cara Analisis Cluster Metode Hirarkis dengan SPSS"

thanks infonya,,izin coba juga

Baru tau saya gan tentang Cara Analisis Cluser Metode Hirarkis dengan SPSS makasih banyak gan :)

Ilmu baru nih :)
izin menyimak sobat :)

Wah Mantap Gan Infonya, Thanks Yah Nice Share

makasih gan nambah ilmu gue, semoga bermanffat bagi gue nie ilmu :D

sipp,, sama-sama, semoga membantu.

ya, silahkan dicicipi gan,,, moga berguna.

hehe,, silahkan disimak update postingan terbaru.

Ok, semoga bermanfaat untuk skripsi gan :D

setelah baca postingan ini saya baru mengerti Analisis Cluster
Thnks ya...sangat bermanfaat...

ngepas banget nih gan ane juga lagi penelitian mengenai cluster grid komputing...
nice info gan (y)

admin www.filegaleri.com

Silahkan tinggalkan komentar, kritik, maupun saran dari sobat blogger tentang apa yang sobat rasakan setelah mengunjungi blog ini.

Back To Top