Penerapan Seleksi Atribut Berdasarkan Koefisien Variansi dan Korelasi untuk Inisialisasi Pusat Awal Klaster pada Algoritma K-Means Dalam Pemetaan E-Government Tahun 2016

Main Article Content

Ivon Dewi Apriliyaningsih
Deden Istiawan

Abstract

Salah satu metode yang terkenal dalam data mining adalah klastering. Klastering adalah metode pengelompokan data sehingga setiap klaster berisi data yang semirip mungkin dan berbeda antar klaster. K-means merupakan salah satu algoritma yang sering digunakan dalam klastering, karena algoritmanya mudah, bisa digunakan untuk menangani jumlah data yang besar dan waktu komputasinya relatif singkat. Namun, K-means sangat sensitif terhadap inisialisasi pusat awal klaster, hasil klaster berupa solusi yang bersifat lokal optimal. Metode A new algorithm Erisoglu, Calis & Sakallioglu didasarkan pada pemilihan dua dari n-atribut yaitu atribut pertama dan atribut kedua. Atribut pertama dihitung menggunakan koefisien variansi, sedangkan atribut kedua dihitung menggunakan koefisien korelasi. Kemudian menghitung rata-rata kedua atribut untuk menjadi pusat klaster. Hasil implementasi dari algoritma K-means dengan metode yang digunakan pada survey E-Government 2016. Setelah dievaluasi dengan Davies Bouldin Index (DBI) dapat dibuktikan nilai DBI metode yang digunakan dalam penelitian ini lebih kecil dan waktu komputasi lebih efisien. Hal ini menunjukan bahwa metode A new algorithm Erisoglu, Calis & Sakallioglu bekerja lebih baik untuk mengatasi inisialisasi pusat awal klaster pada algoritma K-means.

Downloads

Download data is not yet available.

Article Details

Section
Articles