Klasifikasi Halaman Web Dengan Analisis Konteks dan URL

Thursina Andini

Informasi Dasar

113080179
005.1
Karya Ilmiah - Skripsi (S1) - Reference

ABSTRAKSI: Pencarian informasi dapat diperoleh dari internet dengan mudah dan cepat melalui halaman web. Web memuat banyak informasi yang dihasilkan dari waktu ke waktu secara kontinu dari berbagai sumber. Jumlah informasi yang terus bertambah dapat menyulitkan para pencari informasi dalam menemukan informasi yang relevan. Salah satu cara yang dirasa efektif untuk menyelesaikan permasalahan ini adalah dengan melakukan klasifikasi halaman web menurut topiknya.

Salah satu metode untuk mengklasifikasikan halaman web berdasarkan topiknya yaitu categorization by context. Metode categorization by context mengekstrak informasi yang berguna dari sebuah dokumen halaman web untuk mengklasifikasi dokumen dimana URL muncul sebagai rujukannya. Metode ini dirasa efektif karena tidak mengkategorisasikan dokumen pada halaman web menurut isinya namun berdasarkan URL terkait dan tag yang ada pada suatu dokumen<br><br> Sebuah sistem berbentuk sebuah katalog diimplementasikan yang isinya terdiri dari kategori-kategori dari halaman web dimana kategori ditentukan oleh penulis sendiri. Pada implementasi ini dokumen-dokumen diklasifikasikan ke dalam kategori tertentu berdasarkan tag <title> dan URL terkaitnya yang kemudian dicocokan dengan parameter setiap kategori yang didapatkan. Hasil yang diperoleh menunjukkan sebagian besar dokumen terklasifikasi sesuai dengan kategori prediksinya.Kata Kunci : categorization by context, URL terkait, tag<title>ABSTRACT: Searching specific information can be get from internet easily and fast through web pages. Web pages contain many information thar result from time to time continously from many resources. A big number of information make difficult user to find relevant information. One of effective method that can solve this problem is make web page classification based on the subject. <br><br> One of method than can make web page classification based on the subject is categorization by context. This method categorization by context is extracting the useful information form a web page document to classify a document where URL referring to appears. This method can more effective because doesnt categorize a document on web page based on content or text document but based on surrounding links and tag<title> in a document. <br><br> A catalog system implemented which contains categories form web page where a category define by author. In this implementation documents classify into certain category based on surrounding links and tag<title> then match with parameter on each category. The result shows that almost documents classified appropriate with their expected category.Keyword: categorization by context, surrounding links, tag<title></p> </div> </div> </div> </div> </div> <div style="clear: both;"></div> </fieldset> <div style="float: left; width: 49%;"> <fieldset> <h2>Subjek</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_subjek_utama"> <div> <label>Subjek utama</label> <div class="content"> <div class="frozen"> Rekayasa Perangkat Lunak </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_subjek_tambahan"> <div> <label>Subjek tambahan</label> <div class="content"> <div class="frozen">   </div> </div> </div> </div> </fieldset> <fieldset> <h2>Katalog</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_judul"> <div> <label>Judul</label> <div class="content"> <div class="frozen"> Klasifikasi Halaman Web Dengan Analisis Konteks dan URL </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_isbn"> <div> <label>ISBN</label> <div class="content"> <div class="frozen">   </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_kolasi"> <div> <label>Kolasi</label> <div class="content"> <div class="frozen">   </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_bahasa"> <div> <label>Bahasa</label> <div class="content"> <div class="frozen"> Indonesia </div> </div> </div> </div> </fieldset> <fieldset> <h2>Sirkulasi</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_harga_pinjam"> <div> <label>Harga pinjam</label> <div class="content"> <div class="frozen"> Rp. 0 </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_biaya_denda"> <div> <label>Biaya denda</label> <div class="content"> <div class="frozen"> Rp. 0 </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_sirkulasi"> <div> <label>Sirkulasi</label> <div class="content"> <div class="frozen"> Tidak </div> </div> </div> </div> </fieldset> </div> <div style="float: right; width: 49%;"> <fieldset> <h2>Pengarang</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_nama"> <div> <label>Nama</label> <div class="content"> <div class="frozen"> Thursina Andini </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_jenis"> <div> <label>Jenis</label> <div class="content"> <div class="frozen"> Perorangan </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_penyunting/<br/>pembimbing"> <div> <label>Penyunting/<br/>Pembimbing</label> <div class="content"> <div class="frozen"> Yanuar Firdaus A.W., Arie Ardiyanti Suryani </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_alih_bahasa"> <div> <label>Alih bahasa</label> <div class="content"> <div class="frozen">   </div> </div> </div> </div> </fieldset> <fieldset> <h2>Penerbit</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_nama"> <div> <label>Nama</label> <div class="content"> <div class="frozen"> Universitas Telkom </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_kota"> <div> <label>Kota</label> <div class="content"> <div class="frozen"> Bandung </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_tahun"> <div> <label>Tahun</label> <div class="content"> <div class="frozen"> 2012 </div> </div> </div> </div> </fieldset> <fieldset> <h2>Koleksi</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_total"> <div> <label>Total</label> <div class="content"> <div class="frozen"> <a class="item_stock" href="/knowledgeitem/95809/stock.html">1 Koleksi</a> </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_tersedia"> <div> <label>Tersedia</label> <div class="content"> <div class="frozen"> <a class="item_available" href="/knowledgeitem/95809/available.html">1 Koleksi</a> </div> </div> </div> </div> </fieldset> </div> <div style="clear: both"></div> <fieldset> <h2>Kompetensi</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_tidak_ada"> <div> <label>Tidak ada</label> <div class="content"> <div class="frozen">   </div> </div> </div> </div> </fieldset> <!-- patch here <fieldset> <h2>Flipbook</h2> <div class="sf_admin_form_row sf_admin_text master_subject_list"> <div class="error">anda harus log in untuk mengakses flippingbook</div> </div> </fieldset> end of patch --> <fieldset> <h2>Download / Flippingbook</h2> <div class="sf_admin_form_row sf_admin_text knowledge_item_link_file"> <div> <label>Link file</label> <div class="content"> <div class="frozen"> <div class="file_download_list"> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/cover/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">B. Cover (cover.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/cover/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/disclaimer/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">C. Disclaimer (Pernyataan Orisinalitas) yang sudah bertandatangan. (File discan agar document jelas dan rapi) (disclaimer.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/disclaimer/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/lembarpersetujuan/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">D. Lembar Pengesahan yang sudah bertandatangan. (File discan agar document jelas dan rapi) (lembarpersetujuan.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/lembarpersetujuan/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>diunduh 2 kali</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/abstraksi/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">E. Abstrak ( Indonesia ) (abstraksi.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/abstraksi/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>diunduh 1 kali</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/abstract/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">F. Abstract (English) (abstract.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/abstract/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/kpdi/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">H. Kata Pengantar (kpdi.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/kpdi/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/bab1/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">O. BAB 1 (bab1.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/bab1/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/bab2/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">P. BAB 2 (bab2.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/bab2/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/bab3/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">Q. BAB 3 (bab3.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/bab3/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/bab4/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">R. BAB 4 (bab4.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/bab4/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/bab5/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">S. BAB 5 (bab5.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/bab5/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/resume/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">W. Resume (resume.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/resume/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/lampiran/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">Y1. Lampiran (lampiran.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/lampiran/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> <div><a class="item_download_generic item_download_pdf" onclick="return confirm('Dengan mengunduh berkas digital berikut, anda telah menyetujui untuk TIDAK menyebarluaskan, melakukan reproduksi, dan melakukan tindakan plagiat atas isi berkas digital berikut tanpa seijin Universitas Telkom\n\nTerima Kasih')" href="/pustaka/files/95809/jurnal/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf">Z1. Jurnal (jurnal.pdf)</a></div><meta name="citation_pdf_url" content="https://openlibrary.telkomuniversity.ac.id/pustaka/files/95809/jurnal/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.pdf"> <div style="margin-bottom: 10px;"> <i>belum pernah diunduh</i> </div> </div> </div> </div> </div> </div> <div class="sf_admin_form_row sf_admin_text knowledge_item_rekomendasi"> <div> <label>Rekomendasi</label> <div class="content"> <div class="frozen">   </div> </div> </div> </div> </fieldset> <fieldset> <h2>Ulasan</h2> <div class="sf_admin_form_row sf_admin_text review"> <div class="collaboration_review_item" >Belum ada ulasan yang diberikan</div> <div class="error">anda harus sign-in untuk memberikan ulasan ke katalog ini</div> </div> </fieldset> </div> <ul class="sf_admin_actions"> <li class="sf_admin_action_list"><a href="javascript:history.back()">Kembali</a></li> </ul> </div> <div id="sf_admin_footer"></div> </div> <script type="text/javascript"> getStatistic(".knowledge_item_rekomendasi .frozen", "https://openlibrary.telkomuniversity.ac.id/pustaka/95809/klasifikasi-halaman-web-dengan-analisis-konteks-dan-url.html") </script> </div> <div id="footer" style="clear: both">Copyright © 2011 - Telkom Open Library <br><br><b> NPP : 3204122D0000002</b></div> </div> <!-- Piwik --> <script type="text/javascript"> // var _paq = _paq || []; // _paq.push(["setDocumentTitle", document.domain + "/" + document.title]); // _paq.push(["setCookieDomain", "*.openlibrary.telkomuniversity.ac.id"]); // _paq.push(["setDomains", ["*.openlibrary.telkomuniversity.ac.id"]]); // _paq.push(['trackPageView']); // _paq.push(['enableLinkTracking']); // (function() { // var u=(("https:" == document.location.protocol) ? "https" : "http") + "://view.monitoring.telkomuniversity.ac.id/"; // _paq.push(['setTrackerUrl', u+'piwik.php']); // _paq.push(['setSiteId', 15]); // var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.type='text/javascript'; // g.defer=true; g.async=true; g.src=u+'piwik.js'; s.parentNode.insertBefore(g,s); // })(); </script> <!-- <noscript><p><img src="http://view.monitoring.telkomuniversity.ac.id/piwik.php?idsite=15" style="border:0;" alt="" /></p></noscript> End Piwik Code --> <!-- Piwik Image Tracker <img src="http://view.monitoring.telkomuniversity.ac.id/piwik.php?idsite=15&rec=1" style="border:0" alt="" /> End Piwik --> </body> </html> <!--Start of Tawk.to Script--> <script type="text/javascript"> var Tawk_API=Tawk_API||{}, Tawk_LoadStart=new Date(); (function(){ var s1=document.createElement("script"),s0=document.getElementsByTagName("script")[0]; s1.async=true; s1.src='https://embed.tawk.to/5722dfde7ada50bc0277ebc7/default'; s1.charset='UTF-8'; s1.setAttribute('crossorigin','*'); s0.parentNode.insertBefore(s1,s0); })(); </script> <!-- <script> window.chatbaseConfig = { chatbotId: "FSDsJNmiyeqaQOwBPXwY5", } </script> <script src="https://www.chatbase.co/embed.min.js" id="FSDsJNmiyeqaQOwBPXwY5" defer> </script> --> <!--End of Tawk.to Script-->