ABSTRAKSI: Tugas Akhir ini mengimplementasikan suatu mesin indexing dengan menggunakan metode Blocked Sort Based Indexing (BSBI). BSBI merupakan metode yang mengadatasi metode pengurutan eksternal.
Metode BSBI bekerja dengan menggunakan block-block. BSBI akan membaca dokumen, mengurutkan isi dokumen didalam block memory, menuliskannya kedalam database, kemudian menggabungkan seluruh block didalam database menjadi inverted index yang terurut secara alphabetis dan docID.
Tugas Akhir ini dibandingkan waktu indexing dan tempat penyimpanan inverted index ketika proses indexing menggunakan BSBI dan ketika menggunakan Simple Indexing. Sebagai input sistem digunakan dokumen dengan jumlah total term dan jumlah distinct term yang berbeda-beda.
Dengan melakukan indexing menggunakan metode BSBI didapatkan bahwa total waktu yang dibutuhkan untuk BSBI jauh lebih besar jika dibandingkan dengan total waktu Simple Indexing tetapi waktu pemrosesan memory yang dibutuhkan oleh BSBI lebih kecil jika dibandingkan dengan Simple Indexing. Dari segi tempat penyimpanan yang dibutuhkan, metode BSBI membutuhkan tempat penyimpanan hingga enam kali lebih besar dibanding dengan tempat penyimpanan yang dibutuhkan oleh Simpe Indexing.
Kata Kunci : blocked sort based indexing, simple indexing, pengurutan eksternalABSTRACT: The final project implement indexing use Blocked Sort Based Indexing (BSBI) method. BSBI is a method that adapt external sort method.
BSBI work using blocks database. BSBI will extract document, sort contents of document in memory block, write back to database, then merge all blocks database as inverted index that sorted by alphabet and docID.
This final project compare time indexing and space of inverted index when process of indexing use BSBI and Simple Indexing. As input sistem, we use document with different total term dan different distinct term.
When do indexing process with BSBI, found that total time of BSBI bigger than total time of Simple Indexing but memory time for BSBI smaller than Simple Indexing memory time. In space for inverted index, BSBI need six times space than Simple Indexing.
Keyword: blocked sort based indexing, simple indexing, external sort and index