Pengenalan objek merupakan salah satu masalah yang populer dalam bidang computer vision. Banyak pekerjaan manusia yang sudah digantikan oleh mesin, dari
yang fungsinya sederhana sampai mesin yang memiliki fungsi yang kompleks dan
memiliki sistem Artificial Intelligence. Untuk mengikuti perkembangan zaman,
teknologi masa kini dituntut untuk menjadi lebih canggih lagi, salah satunya dapat mengenali objek-objek disekitarnya. Banyak metode pengenalan objek telah
dikembangkan, salah satunya adalah Region-based Convolutional Neural Network
(R-CNN). Banyak arsitektur yang telah dikembangkan untuk menunjang metode
tersebut. Diantaranya adalah ResNet, AlexNet, CifarNet, dll. Arsitektur tersebut
tentunya sudah memiliki hasil yang cukup bagus dan hingga sekarang masih terus
dikembangkan. Beberapa parameter performansi yang diperhatikan adalah Training Error atau seberapa baik sistem mempelajari sebuah tugas, lalu akurasi atau
nilai dari sistem dalam melakukan tugasnya, dan waktu komputasi atau seberapa
cepat sistem melakukan tugas yang diberikan. Maka dari itu penulis melakukan uji
coba untuk menguji ketiga parameter performansi tersebut dengan menggunakan arsitektur ResNet. Mula-mula penulis membagi permasalahan tersebut ke dalam tiga
skenario, dimana skenario 1 ialah training error, skenario 2 akurasi, dan skenario 3
merupakan waktu komputasi. Lalu penulis menentukan parameter yang akan dioptimalisasi, yaitu depth atau kedalaman dari layer, lalu ukuran kernel, dan yang terakhir adalah epoch atau berapa kali backpropagation diulang dalam satu iterasi.
Pada setiap skenario, penulis menguji dan menganalisis hasil dari setiap kombinasi
dari parameter dan melakukan optimalisasi sistem. Dari sistem yang telah dioptimalisasi, penulis mendapatkan hasil terbaik pada training error yaitu 0.118%, lalu
pada akurasi yaitu 90.82%, dan pada waktu komputasi yaitu 0.001169197 sekon.
Kata Kunci: R-CNN, Resnet, training error, akurasi, waktu komputasi