Glaukoma adalah kondisi mata yang disebabkan oleh kerusakan saraf optik. Jika glaukoma tidak ditangani dengan cepat dan efektif, maka dapat terjadi kehilangan penglihatan. Pengamatan dokter mata diperlukan dalam situasi ini untuk memverifikasinya. Pengamatan dokter ahli membutuhkan waktu yang lama dan tidak konsisten karena bersifat subjektif. Untuk mendeteksi glaukoma sejak dini, mengotomatiskan pemrosesan citra fundus, menghemat waktu dengan segmentasi optik disk dan cup, serta menghitung Cup to Disc Ratio (CDR), maka dibuatlah sistem diagnostik berbantuan komputer Computer Assisted Diagnostic (CAD). Penggunaan model berdasarkan Vision Transformers (ViT), Convolutional Neural Networks (CNN), dan campuran keduanya telah disarankan dalam sejumlah penelitian sebelumnya. Model encoder decoder berbasis CNN memiliki ukuran yang sangat besar dan melakukan perhitungan secara perlahan, sementara model ViT memiliki masalah dengan jumlah komputasi model yang meningkat seiring dengan meningkatnya ukuran citra. Oleh karena itu, Dense Prediction Transformer (DPT), yang dapat menangani data secara paralel, dipilih sebagai teknik segmentasi; teknik ini menggunakan transformer sebagai encoder dan konvolusi sebagai decoder. Penelitian ini menggunakan studi kasus segmentasi optik disk dan cup pada citra fundus menggunakan dataset ORIGA untuk implementasi DPT. Hasilnya, model DPT sedikit mengungguli Segmenter dengan perbedaan mIoU = 4,9%.