BAB I
PENDAHULUAN
1.1 Latar Belakang
Proses penggabungan beberapa objek yang memiliki persamaan ciri menjadi suatu kelompok dinamakan pengklasteran. Persamaan ciri objek-objek pada suatu klaster lebih dekat daripada persamaan ciri dengan objek di klaster yang lain. Dengan kata lain jarak objek intra-klaster lebih dekat daripada jarak objek inter-klaster. Pada Sistem Temu Kembali Informasi (information retrieval), analisa klaster digunakan untuk melakukan pengelompokan sekumpulan dokumen berdasarkan kemiripan isi menjadi beberapa klaster. Pada kumpulan dokumen (mixture model) terdapat informasi (hidden variable) nilai tengah µ, variasi Σ dan densitas data p untuk setiap klaster. Untuk mengelompokkan dokumen tersebut akan dilakukan estimasi nilai parameter (µ, Σ, p) dengan pendekatan algoritma Expectation Maximation (EM). Secara iterasi akan dilakukan estimasi nilai parameter dan menghasilkan nilai densitas p secara probabilistik sehingga diketahui kemungkinan suatu dokumen untuk dimasukkan ke dalam suatu klaster tertentu.
Pada algoritma EM membutuhkan waktu akibat iterasi yang harus dilakukan saat estimasi parameter. Untuk mempersingkat iterasi, digunakan struktur data multiresolution kd-tree (MRKD-Tree) berupa binary tree dengan banyak informasi tersimpan di setiap node. Pada multiresolution kd-tree setiap node tidak mewakili satu data melainkan banyak data Pada dokumen, jumlah kata atau term tertentu yang ada didalamnya akan menjadi ciri dokumen tersebut. Sebuah dokumen akan direpresentasikan sebagai vektor dengan elemen-elemen didalamnya adalah jumlah setiap term yang berbeda.
Berdasarkan keadaan inilah maka diperlukan pengetahuan atau informasi mengenai kinerja dari setiap metode, sehingga kesalahan atau ketidak sesuaian dalam memilih metode untuk pengklasteran dapat dihindari.
1.2 Perumusan Masalah
Adapun rumusan masalah yang dibahas dalam penulisan Tugas Akhir ini adalah :
a. Bagaimana menganalisa keakuratan dan kecepatan waktu pada masing-masing metode.
b. Bagaimana menganalisa dan mengurangi eror dalam melakukan pengklasteran
1.3 Tujuan
Tujuan dari kegiatan Tugas Akhir ini adalah :
a. Membantu dalam pengklasterah sekolah sma yang ada di jember.
b. Dari analisa perbandingan metode untuk mendapatkan keakuratan dan kecepatan pada masing-masing metode
1.4 Manfaat
Manfaat dari penelitian antara lain :
a. Dengan adanya pengklasteran antar sekolah sma yang di jember dapat membantu untuk data dengan kelas berdekatan dan berjauhan.
b. Membantu pengguna dalam memperjelas setiap sma dengan kelas berdekatan dan berjauhan.
1.5 Batasan Masalah
Agar tidak menyimpang jauh dari permasalahan, maka Tugas Akhir ini mempunyai batasan masalah sebagai berikut :
a. Analisa dalam tugas akhir ini menggunakan EM-MRKD-Tree dan EM.
b. Dalam Tugas Akhir ini yang dianalisa adalah kelas yang berdekatan dan berjauhan.
c. Jenis data yang dipakai adalah sma yang berada di kabupaten jember.