ABSTRAKSI: XML (eXtensible Markup Language) adalah spesifikasi umum untuk membuat kustom markup language. XML diklasifikasikan sebagai extensible language, karena memperbolehkan pengguna untuk mendefinisikan sendiri elemen-elemen markup, Tujuan dari XML adalah untuk membantu sistem-sistem informasi dalam berbagai struktur data, khususnya melalui internet, disamping itu juga diperuntukan untuk encode ke dokumen-dokumen, dan untuk serialisasi data. Hal ini membuat XML diadaptasi secara luas dan membuat para peneliti untuk membuat Information Retrieval untuk dokumen XML. Dalam tugas akhir ini di bangun Information Retrieval terstruktur dengan menggunakan dokumen XML. Dalam implementasinya algoritma perangkingan yang digunakan adalah algoritma SimNoMerge. Untuk pembobotan dalam algoritma SimNoMerge digunakan tiga jenis pembobotan. Pembobotan menggunakan TF, IDF, dan TF-IDF. Pembobotan tersebut dikombinasikan dalam pengujian penggunaan preprocessing untuk kemudian dianalisis keluarannya.
Hasil penelitian menunjukkan bahwa algoritma SimNoMerge dapat digunakan untuk melakukan perangkingan terhadap dokumen XML, meskipun memiliki nilai pengujian precision yang cenderung rendah, sedangkan untuk pengujian recall memiliki nilai yang lebih baik. Dengan melakukan perbandingan nilai rata – rata presicion dan recall dari hasil pengujian, didapatkan bahwa penggunaan preprocessing dengan kombinasi ketiga jenis pembobotan lebih baik untuk diterapkan dalam sistem information retrieval terstruktur dibandingkan jika tidak menggunakan preprocessing apapun jenis pembobotan yang digunakan.Kata Kunci : Information Retrieval Terstruktur, SimNoMerge, TF, IDF, TF-IDFABSTRACT: XML (Extensible Markup Language) is a general specification to create a custom markup language. XML is classified as an extensible language, because it allows users to define their own markup elements, purpose of XML is to help information systems in a variety of data structures, particularly through the internet, besides that it is also designed to encode the documents, and for serialization data. This makes the XML is widely adapted and made the researchers to make for XML Information Retrieval. In this final task will be develop structured Information Retrieval using XML. SIMNOMERGE is the algorithm used for rank document. For the weighting in the SimNoMerge algorithm used three kinds of weightings. Weighting using the TF, IDF, and TF-IDF. weightings output are then analyzed. This is to measure the performance of the algorithm based on specific weights.
Result showed that the algorithms can be used to SimNoMerge do ranking of XML documents, although a test score is not high precision, whereas for test recall having a better value, this indicates that the algorithm can perform SimNoMerge of ranking result in many irrelevant documents. By comparison the value of averages of precision and recall from the testing, was found that appliying preprocessing with combination of all three types of weighting was better to apply on structured information retrieval instead of not applying preprocessing.Keyword: Structured Information Retrieval, SimNoMerge, TF, IDF, TF-IDF