ABSTRAKSI: Perkembangan teknologi dan kebutuhan akan informasi menyebabkan penumpukan informasi dan data berupa dokumen teks baik dalam bentuk softcopy maupun hardcopy. Kondisi ini menyebabkan sulitnya menemukan dokumen yang sesuai dengan kebutuhan. Untuk memudahkan dalam menemukan dokumen yang sesuai kebutuhan, diperlukan kata kunci yang menyertai setiap dokumen. Kata kunci merupakan kata yang merepresentasikan isi sebuah dokumen secara keseluruhan. Dengan kata kunci, selain memudahkan dalam menemukan dokumen yang sesuai kebutuhan, juga membantu menemukan dokumen lain yang memiliki keterkaitan topik dengan sebuah dokumen.
Pada tugas akhir ini, diimplementasikan metode Artificial Immune System (AIS) berbasis Teori Informasi untuk mengekstrak kata kunci dari sebuah dokumen. Metode ini mengadopsi kemampuan Sistem Imun Alami dalam mengenali zat-zat yang berbahaya yang memasuki tubuh. Dengan metode ini setiap kata dihitung kandungan nilai informasinya untuk menentukan kata kunci. Proses learning dilakukan dengan menyimpan informasi setiap kata setiap kali dilakukan training ataupun ekstraksi untuk digunakan pada ekstraksi berikutnya.
Pengujian dilakukan untuk mendapatkan nilai minimal prosentase kandungan informasi terbaik pada sebuah kata dengan menggunakan metode AIS berbasis Teori Informasi berdasarkan parameter precision, recall, dan f-measure dalam memprediksi 10 term dengan nilai tf-idf yang tertinggi. Selain itu pengujian juga dilakukan untuk mengetahui pengaruh penambahan proses eliminasi stopwords terhadap hasil ekstraksi. Berdasarkan pengujian didapatkan minimal prosentase kandungan informasi terbaik pada sebuah kata yaitu minimal 90% dari total keseluruhan entropi dokumen set dan sekitar 50% sampai 90% dari entropi kategori di mana kata tersebut berasal. Semakin rendah nilai minimal prosentasi kandungan informasi pada sebuah kata, semakin besar pengaruh proses eliminasi stopwords terhadap peningkatan nilai precision hasil ekstraksi. Sebaliknya, semakin tinggi nilai minimal prosentasi kandungan informasi pada sebuah kata, semakin kecil pengaruh proses eliminasi stopwords terhadap peningkatan nilai precision hasil ekstraksi. Namun penambahan proses eliminasi stopwords juga dapat menurunkan nilai recall apabila ada di antara 10 term dengan nilai tf-idf tertinggi yang terdapat pada daftar stopwords yang akhirnya menurunkan nilai f-measure.Kata Kunci : Artificial Immune System (AIS), ekstraksi kata kunci, kata kunci, Teori Informasi.ABSTRACT: Technological developments and the need for information led to the accumulation of information and data in text documents in the form of softcopy and hardcopy. This condition causes difficulty in finding the appropriate documents with the needs. For ease of finding documents as needed, take the keywords that accompany each document. Keyword is a word that represents the contents of a document as a whole. With keywords, not only make it easier to find documents as needed, but also helped to find other documents that have relevance to the topic of a document.
In this final task, the method implemented Artificial Immune System (AIS) are based on information theory to extract the keywords from a document. This method adopted the Natural Immune System's ability to recognize the substances that enter the body's harmful. With this method the content of each word is calculated to determine the information value of keywords.The process of learning is done by storing information every word every time, or the extraction of training conducted for use in the next extraction.
Tests were conducted to obtain the minimum value of the percentage content of the best information on a word using AIS method based on information theory parameters precision, recall, and f-measure in predicting the 10 terms with the highest tf-idf value. In addition the test was also performed to determine the influence of the addition of a process of elimination of stopwords extracted. Based on a minimum percentage of the test obtained the best information on the content of a word that is at least 90% of the total entropy of the document sets and about 50% to 90% of the entropy of the category in which the word originated. The lower the minimum percentage of the value of the information content in a word, the bigger the influence of stopwords elimination process increased the value of precision results of extraction. Conversely, the higher the minimum percentage of the value of information content in a word, the smaller the effect of stopwords elimination process increased the value of precision results of extraction. But the addition of stopwords elimination process can also be lowered if there is a recall value among the 10 terms with highest tf-idf values found in the list of stopwords which ultimately reduce the value of f-measure.Keyword: Artificial Immune System (AIS), keyword extraction, keyword, Information Theory.