Klasifikasi Teks dengan Menggunakan Improved K-Nearest Neighbor Algorithm

Gema Megantara

Informasi Dasar

113060240
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Klasifikasi merupakan proses mengelompokkan suatu data ke dalam kelompok data yang telah ditentukan berdasarkan tingkat kemiripannya. Klasifikasi ini pun dapat diterapkan dalam dokumen teks, dengan tujuan mempermudah penentuan seluruh dokumen dengan kategori tertentu. Terdapat berbagai cara untuk melakukan klasifikasi, salah satunya dengan menggunakan metode K-Nearest Neighbor. Metode K-Nearest Neighbor merupakan metode yang populer dalam klasifikasi, karena kemudahan dalam implementasinya.

Tetapi dibalik kemudahannya itu metode K-Nearest Neighbor memiliki kelemahan jika digunakan dalam dokumen yang memiliki distribusi yang tidak merata, karena saat nilai k yang digunakan semakin besar akan ada dominasi oleh kelas yang berukuran besar terhadap kelas yang berukuran kecil. Oleh karena itu digunakan metode Improved K-Nearest Neighbor untuk menanggulangi kelemahan tersebut.

Untuk mengevaluasi performansi dari K-Nearest Neighbor dan Improved KNearest Neighbor digunakan precision, recall, dan F1-Measure. Hasil yang didapat menunjukkan bahwa metode Improved K-Nearest Neighbor dapat menghilangkan efek dominasi dari kategori terbesar dalam berbagai jenis distribusi dokumen training.Kata Kunci : klasifikasi, K-Nearest Neighbor, Improved K-Nearest NeighborABSTRACT: Classification is the process that grouping the data into the class based on similarity level. Classification can be also applied in text document, to make easier act of determining whole document with certain category. There is a various way to do the classification, one of them is with the K-Nearest Neighbor method. The K-Nearest Neighbor is a popular method in classification because of easy in implementation.

But, behind in the easiness, the K-Nearest Neighbor method has a weakness if it be used in a document that has uneven distribution, because when the k value more and more bigger will appear domination by the bigger class to the smaller class. Therefore the Improved K-Nearest Neighbor method has been used for to cope with the weakness.

Precision, recall, and F1-Measure are used for evaluating the performance from the K-Nearest Neighbor method and Improved K-Nearest Neighbor method. The result shows that the Improved K-Nearest Neighbor method can eliminate the domination effect from the largest category in various kind of document training distribution.Keyword: classification, K-Nearest Neighbor, Improved K-Nearest Neighbor

Subjek

Rekayasa Perangkat Lunak
 

Katalog

Klasifikasi Teks dengan Menggunakan Improved K-Nearest Neighbor Algorithm
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Gema Megantara
Perorangan
Angelina Prima Kurniati, Arie Ardiyanti Suryani
 

Penerbit

Universitas Telkom
Bandung
2010

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini