ABSTRAKSI: Begitu banyak trafik SMS yang masuk dan keluar pada server Content Provider. Setiap bulan bisa mencapai jutaan SMS yang diproses. Tetapi pada kenyataannya tidak semua SMS dapat diproses dengan normal, karena kesalahan keyword SMS yang dikirimkan. Sehingga balasan yang diterima pengguna pun kurang tepat.
Untuk meningkatkan pelayanan pelanggan, data SMS yang banyak itu bisa dipelajari lebih lanjut dengan memahami polanya. SMS yang masuk diberikan kategori tertentu, agar balasan yang diterima pelanggan bisa sesuai dengan yang diharapkan. Sehingga dengan memberikan balasan yang tepat, diharapkan bisa menambah pelanggan yang registrasi. Kategori yang diberikan terhadap SMS yaitu unregistrasi, registrasi, atau lainnya.
Tugas akhir ini dibuat menggunakan metode Naïve Bayes dengan implentasi berbasis web menggunakan PHP sebagai bahasa pemrograman dan MySQL sebagai pengelolaan database. Sistem ini diaplikasikan pada server content provider. Hasil setelah implementasi sistem klasifikasi, terjadi penurunan jumlah SMS yang masih tidak dapat dikenali mencapai 50%. Tingkat akurasi dapat mencapai 95,77% dan sebaran kata yang dihasilkan yaitu unreg, reg, un, off, stop, of, berhenti, batal, unrek, unsub, ureg, undreg, unrec, unreq, anreg, unreng, dan jangan untuk SMS kategori unregistrasi serta sebaran kata reg, ketik, kirim, sms, rec, rek, mau, regit, sepasi, info, apa, pulsa, ada, no, dan on untuk SMS kategori registrasi.
Kata Kunci : content provider, SMS, Naïve Bayes, server.ABSTRACT: There is a lot of incoming and outgoing SMS traffic from Content Provider server to telecommunication operator. Every month it can reach million SMS. But not every SMS can be processed normally, because of wrong SMS keyword that sent by user. So SMS reply that user accept is not accurate.
In gaining better service to user as good as possible, a lot of data SMS can be learned by understanding the SMS pattern. Incoming SMS is given with category, SMS reply is expected with user want. By giving appropriate SMS reply, it is expected can gain user registration. The SMS category is unregistration, registration, and other.
This final project is using Naïve Bayes method and implemented with web based using PHP as programming language and MySQL as database management. This system is applied at content provider server. After implementation of classification system, unrecognized SMS has derivation up to 50%. Accuration can reach 95,77% and word spread for unregistration category is unreg, reg, un, off, stop, of, berhenti, batal, unrek, unsub, ureg, undreg, unrec, unreq, anreg, unreng, and jangan, while for registration category is reg, ketik, kirim, sms, rec, rek, mau, regit, sepasi, info, apa, pulsa, ada, no, and on.
Keyword: content provider, SMS, Naïve Bayes, server.