ABSTRAKSI: Sistem Information Retrieval adalah sistem yang digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi berdasarkan query dari pengguna. Suatu sistem information retrieval dikatakan ideal jika sistem tersebut dapat menemukan seluruh dokumen yang relevan saja. Akan tetapi, term-term yang terdapat di dokumen dan di query sering memiliki banyak varian morfologik, sehingga pasangan term seperti ”compute”, “computing” dan “computation” tidak akan dianggap ekuivalen sistem.
Teknik stemming diterapkan pada sistem information retrieval untuk mengubah varian morfologik dari term-term menjadi sebuah bentuk kata sehingga dianggap ekuivalen oleh sistem, Selain itu stemming juga mampu mengurangi ukuran index file. Pada tugas akhir ini dibuat sebuah sistem information retrieval yang mengimplementasikan teknik stemming menggunakan algoritma STANS.
Algoritma STANS merupakan salah satu teknik affix removal stemmer yang terbentuk dari modifikasi algoritma porter’s stemming. Pada tugas ini dilakukan pula analisis pengaruh penerapan stemming menggunakan algoritma STANS. Hasil penelitian menunjukkan bahwa dengan stemming sistem mampu mereduksi term yang dihasilkan sehingga mampu mengurangi ukuran index. Dari sudut pandang performansi sistem, bisa dikatakan penerapan algoritma STANS lebih baik dibanding algoritma Porter dimana nilai precision, iap dan non-iap yang dihasilkan menunjukkan peningkatan tanpa mengurangi nilai recall yang dihasilkan.
Kata Kunci : Sistem information retrieval, Stemming, Algoritma STANSABSTRACT: Information retrieval system is a system used to find relevant informations from a collection of information based on a query that a user need. A System information retireval is said to be ideal when the system can find only the relevan document in its search. But usually there are terms used in a document and query that has a lots of morphological variants that made the terms such as ”compute”, “computing” and “computation” are not equivalent to the system.
Stemming technic is implemented in an information retrieval system to change the morphological variant terms into a form of term which is equivalent to the system. Beside that stemming can also reduce the size of the index file. In this final project we implemented a stemming technic using STANS algorithm in an information retrieval system.
STANS algorithm is one of the affix removal stemmer technic that is formed from the modification of porter’s stemming. In this final project we analyzed the effect of implementing stemming using STANS algorithm. The result of the research is that stemming can reduce the terms that brings the effect of reducing the index file size. In the perspective of the system’s performance we can said that the implementation of STANS algorithm is better than Porter’s based on the result of precision, IAP, and non IAP that shows an increment without reducing the result of the recall.
Keyword: information retrieval system, stemming, STANS algorithm