Selasa, 17 Januari 2012

Proposal TA

BAB I
PENDAHULUAN

1.1 Latar Belakang
Proses penggabungan beberapa objek yang memiliki persamaan ciri menjadi  suatu  kelompok  dinamakan pengklasteran.  Persamaan ciri objek-objek pada suatu klaster lebih dekat daripada persamaan ciri dengan objek di klaster yang lain. Dengan kata lain jarak objek intra-klaster lebih dekat daripada jarak objek inter-klaster. Pada Sistem Temu Kembali Informasi (information retrieval),  analisa  klaster digunakan untuk melakukan pengelompokan  sekumpulan  dokumen berdasarkan kemiripan isi menjadi beberapa klaster. Pada kumpulan dokumen (mixture model) terdapat informasi (hidden variable) nilai tengah µ, variasi Σ dan densitas data  p  untuk setiap klaster. Untuk mengelompokkan dokumen  tersebut akan dilakukan estimasi nilai parameter  (µ,  Σ,  p)    dengan pendekatan  algoritma  Expectation Maximation (EM).  Secara iterasi akan dilakukan estimasi nilai parameter dan menghasilkan nilai densitas  p  secara probabilistik sehingga diketahui kemungkinan suatu dokumen untuk dimasukkan ke  dalam suatu klaster tertentu.
Pada  algoritma EM  membutuhkan  waktu akibat iterasi yang harus dilakukan saat estimasi parameter. Untuk mempersingkat iterasi, digunakan struktur data  multiresolution kd-tree  (MRKD-Tree)  berupa binary tree  dengan banyak informasi tersimpan di setiap node. Pada multiresolution kd-tree setiap node tidak mewakili satu data melainkan banyak data Pada dokumen, jumlah kata atau  term  tertentu yang ada didalamnya akan menjadi ciri dokumen tersebut. Sebuah dokumen akan direpresentasikan sebagai vektor dengan elemen-elemen didalamnya adalah jumlah setiap  term yang berbeda.
Berdasarkan keadaan inilah maka diperlukan pengetahuan atau informasi mengenai kinerja dari setiap metode, sehingga kesalahan atau ketidak sesuaian dalam memilih metode untuk pengklasteran dapat dihindari.



1.2   Perumusan Masalah
Adapun rumusan masalah yang dibahas dalam penulisan Tugas Akhir ini adalah :
a.    Bagaimana menganalisa keakuratan dan kecepatan waktu pada masing-masing metode.
b.    Bagaimana menganalisa dan mengurangi eror dalam melakukan pengklasteran
1.3   Tujuan
Tujuan dari kegiatan Tugas Akhir ini adalah :
a.         Membantu dalam pengklasterah sekolah sma yang ada di jember.
b.        Dari analisa perbandingan metode untuk mendapatkan keakuratan dan kecepatan pada masing-masing metode

1.4   Manfaat
      Manfaat dari penelitian antara lain :
a.         Dengan adanya pengklasteran antar sekolah sma yang di jember dapat membantu untuk data dengan kelas berdekatan dan berjauhan.
b.        Membantu pengguna dalam memperjelas setiap sma dengan kelas berdekatan dan berjauhan.

1.5   Batasan Masalah
Agar tidak menyimpang jauh dari permasalahan, maka Tugas Akhir ini mempunyai batasan masalah sebagai berikut :
a.    Analisa dalam tugas akhir ini menggunakan EM-MRKD-Tree dan EM.
b.    Dalam Tugas Akhir ini yang dianalisa adalah kelas yang berdekatan dan berjauhan.
c.    Jenis data yang dipakai adalah sma yang berada di kabupaten jember.