Kenaikan jumlah pengguna internet sebagai media komunikasi terus meningkat, memungkinkan terjadinya anomali yang dapat mengganggu lalu lintas jaringan. Anomali memiliki potensi terhadap suatu serangan atau ancaman pada sebuah komputer ataupun server. Banyak macam-macam tipe serangan dalam sebuah jaringan internet seperti DoS (Denial of Service), DDoS (Distributed Denial of Service), flash crowd, dan sebagainya. Pengaruh negatif anomali merugikan banyak pihak, baik dari sisi user ataupun pihak penyedia layanan internet. Berdasarkan masalah tersebut, dibuat sebuah sistem yang dapat melakukan proses learning untuk menangani penuruan jumlah anomali secara bertahap.
Dalam proses penurunan anomali trafik, menggunakan satu teknik learning yaitu Reinforcement Learning (RL). RL adalah suatu pembelajaran yang dilakukan oleh agent (Learner) dengan cara berinteraksi terhadap lingkungan yang masih asing, tujuannya untuk mengambil keputusan secara langsung di lingkungan tersebut. Agent berinteraksi dengan cara memilih dan mengeksekusi sebuah aksi. Lingkungan akan memberikan sebuah state baru dan juga respon berupa feedback dalam bentuk positif atau negatif reward. Signal reward diberikan sesuai dengan hasil evaluasi pada kualitas perfomansi aksinya. Proses learning terjadi saat agen memilih aksi berupa presentasi jumlah penurunan anomali, karena penurunan anomali tidak terjadi secara drastis, melainkan dengan tahapan RL. Algoritma fuzzy digunakan untuk proses penentuan jumlah service yang akan dikontrol sebelum masuk ke proses RL.
Penilitian tugas akhir ini menghasilkan sebuah sistem yang dapat melakukan proses learning terhadap penuruan laju anomali. Setiap 100 trafik yang masuk akan dievaluasi, dan berpengaruh terhadap Q-value masing-masing service. Dengan melakukan proses testing, yang telah disesuaikan dengan hasil training menghasilkan penuruan anomali sebesar 64%. Dominasi anomali berada pada service ftp-data dan telnet.
Kata Kunci: Anomali trafik, Reinforcement Learning, reward, action, Algoritma Fuzzy