ABSTRAKSI: Sistem information retrieval adalah suatu sistem yang terdiri dari beberapa tahapan dalam usaha menemukan dokumen yang relevan dalam kumpulan dokumen. Pada umumnya sistem information retrieval menggunakan stemmer untuk mereduksi berbagai variasi morfologi yang terdapat pada dokumen sumber. Karena terkait dengan bahasa dokumen yang digunakan, maka umumnya stemmer yang digunakan dibuat berdasarkan aturan bahasa tertentu. Sedangkan bahasa dokumen yang digunakan bisa saja lebih dari satu bahasa.
Sistem ini mengimplementasikan n-gram stemmer yang merupakan sebuah metode stemming yang tidak terikat dengan satu aturan bahasa apapun. Sebagai bahan uji, bahasa yang digunakan dalam dokumen terdiri dari bahasa Inggris dan Prancis. Selain itu sebagai pembanding dengan stemmer yang umum digunakan pada satu bahasa digunakan porter stemmer.
Hasil pengujian yang telah dilakukan pada Tugas Akhir ini menunjukkan penerapan n-gram stemmer bisa dilakukan terhadap dokumen lebih dari satu bahasa. Kekuatan kompresi dan akurasi yang dihasilkan n-gram stemmer jika dibanding dengan porter maka hasilnya bervariasi tergantung nilai n pada n-gram yang digunakan.
Kata Kunci : sistem information retrieval, stemming, n-gram stemmerABSTRACT: Information retrieval system is a system consisting of several stages in an attempt to find relevant documents in a collection of documents. In general, information retrieval systems use a stemmer to reduce various morphological variation found in the source document. Since the document related to the language used, it is generally used stemmer is based on the rules of a particular language. While the language used in documents that could have been more than one language.
This system implements a n-gram stemmer stemming which is a method that is not bound by the rules of any language. As test material, the language used in the document consists of English and French. Also as a comparison with the commonly used stemmer in one language is used porter stemmer.
The test results that have been done on this final show the application of n-gram stemmer can be done to document more than one language. Compression strength and accuracy of the resulting n-gram stemmer if compared with the porter, the results vary depending on the value of n on n-gram is used.
Keyword: information retrieval, stemming, n-gram stemmer