Analisis dan Implementasi Algoritma Rabin-Karp dan Algoritma Stemming Nazief-Adriani pada Sistem Pendeteksi Plagiat Dokumen Teks Berbahasa Indonesia

Yosef Agung Wicaksono

Informasi Dasar

113081103
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Plagiarisme berasal dari bahasa latin yaitu plagiarus, yang artinya pengambilan karya orang lain, berupa tulisan, makalah, atau pendapat dan sebagainya, untuk diakui sebagai hasil karya si pelaku. Praktek ini sudah sering terjadi khususnya pada kalangan akademisi. Untuk mengantisipasinya, dibutuhkan suatu cara yang dapat menganalisis teknik-teknik plagiat yang dilakukan. Ada beberapa pendekatan atau teknik yang dapat diambil, salah satunya adalah dengan pecocokan string/term. Untuk pencocokan string/term terdapat beberapa algoritma yang ada, salah satunya adalah algoritma pencarian string Rabin-Karp. Algortima Rabin-Karp menggunakan fungsi hash dalam proses string matching. Fungsi hash inilah yang menjadi kunci algoritma Rabin-Karp. Algoritma Rabin-Karp sangat cocok untuk diterapkan dalam pendeteksian plagiarisme dokumen, karena algoritma ini cocok untuk pola pencarian jamak(multiple pattern search).Untuk melakukan deteksi plagiarism dokumen, khususnya dokumen berbahasa Indonesia, perlu adanya proses preprocessing sebelum suatu dokumen siap untuk masuk ke dalam proses inti yaitu string matching. Di dalam proses preprocessing terdapat tahapan yaitu case folding, tokenization, number removal, filtering dan terakhir yaitu stemming atau pengembalian suatu kata ke bentuk asalnya (kata dasar). Untuk melakukan tahapan stemming terdapat beberapa algoritma salah satunya adalah algoritma stemming Nazief-Adriani. Algoritma stemming Nazief-Adriani mempunyai persentase keakuratan (presisi) yang lebih besar dibandingkan dengan algoritma-algoritma stemming lainnya. Hasil keakuratan algoritma stemming Nazief-Adriani sangat dipengaruhi kelengkapan dari kamus kata dasar yang ada. Semakin lengkap kamus kata dasar maka akan semakin akurat pula hasil stemming. Sesudah preprocessing dan proses string matching, langkah terkahir adalah menghitung similarity antar dokumen.Kata Kunci : plagiarisme, string matching, Rabin-Karp, fungsi hash, preprocessing, case folding, tokenization, number removal, filtering, stemming, Nazief-Adriani, hashing, similarity, dokumen.ABSTRACT: Plagiarism comes from the Latin language that is plagiarus, which means taking other people's work, form of writing, paper, or opinion, and so on, to be recognized as the work of the offender. This practice is particularly common in academic circles. To anticipate, we need a way to analyze the techniques of plagiarism committed. There are several approaches or techniques that can be taken, one of which is to matching string / term. For matching string / term there are several existing algorithms, one of which is the Rabin-Karp string matching algorithm. Rabin-Karp algorithm use hash function in string matching process. This hash function is the Rabin-Karp algorithm’s key. Rabin-Karp algorithm is suitable to be applied in a document plagiarism detection, since the algorithm is suitable for multiple search patterns.To perform plagiarism detection, particularly documents written in Indonesia, the need for preprocessing process before a document is ready to enter into the core of the string matching process. In the preprocessing there are contains several steps, case folding, tokenization, number removal, filtering and the last is stemming or return to the original form (root). To conduct stemming steps there are several algorithms one of which is Nazief-Adriani stemming algorithm. Nazief-Adriani stemming algorithms have percentage accuracy (precision) is greater than the other stemming algorithms. Accuracy of the results stemming algorithm Nazief-Adriani strongly influenced the completeness of the root words dictionaries. The more complete dictionary of root words are the more accurate the stemming results. After preprocessing and string matching process, the last step is measure the similarity between documents.Keyword: plagiarism, string matching, Rabin-Karp, hash function , preprocessing, case folding, tokenization, number removal, filtering, stemming, Nazief-Adriani, hashing, similarity, documents.

Subjek

Informatika Teori dan Pemrograman
 

Katalog

Analisis dan Implementasi Algoritma Rabin-Karp dan Algoritma Stemming Nazief-Adriani pada Sistem Pendeteksi Plagiat Dokumen Teks Berbahasa Indonesia
 
 
Indonesia

Sirkulasi

Rp. 0
Rp. 0
Tidak

Pengarang

Yosef Agung Wicaksono
Perorangan
Suyanto, Suyanto
 

Penerbit

Universitas Telkom
Bandung
2012

Koleksi

Kompetensi

 

Download / Flippingbook

 

Ulasan

Belum ada ulasan yang diberikan
anda harus sign-in untuk memberikan ulasan ke katalog ini