Segmentasi citra sidik tulang merupakan langkah penting dalam melakukan deteksi dini terhadap persebaran tumor pada tubuh manusia. Dengan membagi tulang ke kelompok tertentu, dapat dihitung nilai Bone Scan Index untuk menindaklanjuti penyakit kanker. Beberapa penelitian telah dilakukan pada kasus ini, seperti mengembangan Computer Aided Diagnosis (CAD) oleh EXINI, pengembangan Active Shape Model (ASM) dan Constrained Local Model (CLM). Namun, model-model ini masih mengandalkan anotasi berupa landmark points, belum menggunakan mask segmentasi dalam proses pelatihan modelnya. Model konvolusi terbaru, DeepLab, mengandalkan mekanisme konvolusi untuk mengekstraksi fitur secara lokal. Model terbaru pula dengan pendekatan transformer, Segmenter, dapat mengekstraksi fitur global secara paralel. Adapun model dengan dua pendekatan, Dual Attention Network (DANet), menggunakan backbone seperti DeepLab dan mengimplementasikan modul atensi untuk menangkap informasi kontekstual jarak jauh. Dalam penelitian ini, sistem segmentasi citra sidik tulang menggunakan DANet akan diusulkan. Anotasi berisi 12 kelas yang berbeda pada bagian tulang. Hasil menunjukkan bahwa pendekatan DANet dengan atensi dan konvolusi mengalahkan perfoma model-model lain pada dataset anterior dan posterior. Performa dengan nilai mIoU sebesar 76,85% dan 80,99% dicapai pada dataset anterior dan posterior.