Sistem komunikasi Device-to-Device (D2D) underlaying dapat digunakan sebagai solusi dalam meringankan beban kerja eNodeB dan juga meningkatkan data rate sistem. Sistem komunikasi ini terdiri dari dua user, yaitu Cellular User Equipment (CUE) dan pasangan D2D, dimana resource block yang digunakan oleh pasangan D2D dan CUE adalah sama. Akan tetapi, pemakaian resource block secara bersamaan dapat mengakibatkan terjadinya interferensi. Oleh karena itu, dibutuhkan skema pengalokasian resource yang efektif kepada pasangan D2D untuk mengurangi dampak interferensi yang terjadi.
Dalam penelitian ini, dilakukan skema pengalokasian resource block pada single cell dengan arah komunikasi uplink. Proses pengalokasian resource block menggunakan algoritma joint greedy dan greedy dengan alokasi daya menggunakan algoritma State Action Reward State Action (SARSA). Kemudian dilakukan perbandingan performansi menggunakan algoritma joint greedy dan greedy tanpa alokasi daya.
Berdasarkan simulasi yang dilakukan, proses alokasi resource block menggunakan algoritma joint greedy dan greedy dengan alokasi daya menggunakan algoritma SARSA memberikan performansi yang sangat baik dalam hal sumrate dengan nilai rata-rata 3,878 × 10^8 bps, efisiensi energi dengan nilai rata-rata 1,373 × 10^7 bps/watt, efisiensi spektral dengan nilai rata-rata 43,086 bps/Hz, indeks fairness sisi
D2D dengan nilai rata-rata 0,99525, dan indeks fairness sisi eNodeB dengan nilai rata-rata 0,696.
Kata Kunci : Device-to-device, Resource Block, SARSA, Joint Greedy, Greedy