Informasi Umum

Kode

16.04.2423

Klasifikasi

006.312 - Data mining

Jenis

Karya Ilmiah - Skripsi (S1) - Reference

Subjek

Text Mining

Dilihat

199 kali

Informasi Lainnya

Abstraksi

Tekxtual Similarity/Relatedness bisa jadi merupakan landasan yang penting dalam melakukan keterhubungan antar teks dalam ilmu-ilmu teks mining lainnya, seperti sentimen analisis, teks kategorisasi, dll. Keterhubungan teks tersebut dapat berupa keterkaitan yang ditentukan apakah teks tersebut memiliki keterkaitan secara lexical atau semantic. Sehingga penelitian ini dilatar belakangi dengan adanya masalah belum tersedianya komputer yang dapat menyamai persepsi manusia terkait penilaian keterkaitan antar kata untuk mempermudah dalam penelitian-penelitian teks lainnya. Keterkaitan dari inputan teks tersebut dapat dihitung dengan menggunakan metode Explicit Semantic Analysis (ESA). Metode ini menghitung keterkaitan antar dua kata yang akan dirubah menjadi bentuk skor dengan rentang antara 0-1 sesuai tingkat keterkaitannya. Database yang digunakan dalam perhitungan adalah artikel wikipedia dengan total sebanyak 2000 judul, digunakan karena dianggap merupakan sumber knowledge terbesar di internet. Pengujian dilakukan dengan membandingkan perhitungan tf.idf ESA secara biner dan nonbiner. Serta untuk mengetahui pengaruh jumlah judul artikel terhadap skor, pengujian juga dibedakan berdasarkan jumlah artikelnya sebanyak 500, 1000 dan 2000 judul. Setelah masing-masing skor keterkaitan dari setiap pengujian didapatkan, kemudian skor tersebut dibandingkan dan dihitung nilai korelasinya dengan gold standard wordsim353 relatedness dan gold standard MEN. Korelasi yang dihasilkan untuk pengujian 2000 judul artikel pada perhitungan biner sebesar 0,2789 dan nonbiner sebesar 0,3958 untuk gold standard wordsim353 relatedness. Sedangkan untuk gold standard MEN, korelasi yang dihasilkan untuk pengujian 2000 judul artikel pada perhitungan biner sebesar 0,4249 dan nonbiner sebesar 0,4998.

  • CDG4M3 - TOPIK KHUSUS SIDE 2
  • IFG444 - TUGAS AKHIR II
  • MUG2D3 - PROBABILITAS DAN STATISTIKA
  • CSH4H3 - PENAMBANGAN TEKS

Koleksi & Sirkulasi

Tersedia 1 dari total 1 Koleksi

Anda harus log in untuk mengakses flippingbook

Pengarang

Nama ABIYAN SATRIO PRATOMO
Jenis Perorangan
Penyunting Moch. Arif Bijaksana, M. Syahrul Mubarok
Penerjemah

Penerbit

Nama Universitas Telkom
Kota Bandung
Tahun 2016

Sirkulasi

Harga sewa IDR 0,00
Denda harian IDR 0,00
Jenis Non-Sirkulasi