ABSTRAKSI: Kebutuhan akan informasi yang semakin meningkat menuntut adanya suatu cara untuk memberikan informasi yang tepat dan tepat. Sistem temu kembali dibangun untuk menyelesaikan masalah tersebut.
Indexing dan matching adalah dua proses utama dalam Information retrieval, yang akan mengolah kata kunci dan sumber dokumen untuk selanjutnya mengembalikan dokumen-dokumen yang relevan. KL-Divergence adalah salah satu metode yang diterapkan pada proses matching atau retrieve dokumen. Metode ini menghitung kedekatan antara tiap dokumen terhadap query atau kata kunci, sehingga diperoleh score tiap-tiap dokumen yang relevan. Dari hasil indexingnya, KLDivergence menghitung nilai kedekatan dokumen terhadap query yang telah dibangun dengan term model dan dependency language model yang mengandung adanya ketergantungan term dalam kalimat. Dari dua nilai kedekatan dokumen terhadap query ini , hasilnya akan diakumulasikan dengan linear interpolation method, sehingga akan diperoleh score total dokumen.
Dengan mengimplementasikan KL-Divergence dengan linear interpolation method, dapat diperoleh nilai precision yang semakin tinggi pada jumlah dokumen yang semakin rendah. Nilai precision tertinggi terdapat pada jumlah dokumen 100, yaitu 13.57%, dan memberikan nilai recall yang semakin tinggi pada jumlah dokumen yang semakin tinggi. Nilai recall tertinggi pada dokumen 1033, yaitu 93.30%. Nilai IAP semakin tinggi pada nilai λ yang semakin rendah, yaitu pada λ=0.1 memiliki nilai IAP 61.42%.Kata Kunci : information retrieval, KL-divergence, dependency language model.ABSTRACT: The increasing of information needs insist the way to get the fast and exact information. The information retrieval system was assisted to solve these problem.
document collection in order to give the exact return hits. KL-divergence is a methode that could be used in matching or retrieve process. This method counts the closeness between document and query, therefore the system could give the relevance documents for the user. From the result of indexing process, KL-divergence counts the closeness between document and query that have been indexed by term model and dependency language model. From these two score of the closeness, the result would be accumulated with linear interpolation method, therefore the total score could be retrieve.
By implemented KL-divergence with linear interpolation method, the higher precision could be reached from the lowest amount of document collection. The highest precision is in 100 document collection, that is 13.57%, and higher recall could be reached from the highest amount of document collection. The highest recall is in 1033 document collection, that is 93,30%. Higher IAP could get from the lowext amount of λ, that is λ=0.1 , IAP = 61.42%.Keyword: information retrieval, KL-divergence, dependency language model.