ABSTRAKSI: Semakin meningkatnya kebutuhan manusia pada informasi di masa kini menimbulkan permasalahan berupa menemukan dokumen yang relevan dengan kebutuhan secara tepat. Sistem temu kembali dapat dibangun untuk menyelesaikan masalah tersebut.
Sistem temu kembali terdiri dari preprocessing subsystem dan indexing subsystem, untuk mengolah kumpulan dokumen dan kata kunci sehingga dapat mengembalikan dokumen yang relevan. Metode Core Window Based yang diimplementasikan pada pembobotan dokumen, memberikan skor kemiripan berdasarkan kedekatan term dan kemunculan kata penting dalam dokumen (core word). Pada akhirnya, sistem temu kembali dengan metode Core Windows Based dapat memunculkan dokumen relevan sesuai yang diinginkan.
Dalam Tugas Akhir ini digunakan metode TF-IDF dan IDF sebagai metode menemukan kata penting. Pengujian dilakukan pada seluruh Dataset CRAN dan MED. Melihat dari hasil pengujian, IDF menghasilkan nilai lebih baik dari segi precision. Sementara itu, TF-IDF menghasilkan nilai paling baik untuk recall.
Kata Kunci : information retrieval, core word, Core Window Based, term.ABSTRACT: Growing of amount informations needed by people at present, generates problem in the form of finding relevant document to the need accurately and quickly. Information retrieval system can assist to solve this problem.
Information retrieval system consist of preprocessing subsystem and indexing subsystem that cultivate the document collection and query to get the relevance document. Core Window Based method that is implemented in indexing subsystem, will return the relevance score based on closer term in document and important word that call core word. For the last, information retrieval with core windows based can show relevan documents that needed.
In this final project used TF-IDF and IDF method to find core word. Testing implemented in all Dataset CRAN and MED. Show from the experiment, IDF better than TF-IDF on the precision parameter. But TF-IDF better than IDF on the recall parameter. Then for windows parameter, width windows 3 is the best in MED dataset and width windows 5 is the best on the CRAN dataset.Keyword: information retrieval, core word, Core Window Based, term