Penerapan Algoritma C4.5 pada Aplikasi Prediksi Kelulusan Mahasiswa Prodi Informatika

Ratna Puspita Sari Putri(1*), Indra Waspada(2),

(1) Departemen Ilmu Komputer/Informatika Universitas Diponegoro
(2) Departemen Ilmu Komputer/Informatika Universitas Diponegoro
(*) Corresponding Author
DOI: https://doi.org/10.23917/khif.v4i1.5975

Abstract

Data tentang mahasiswa yang lulus merupakan sebuah data yang penting baik bagi departemen, fakultas maupun universitas karena data tersebut digunakan dalam proses akreditasi. Data tentang mahasiswa yang lulus terus bertambah di tiap tahunnya dan menumpuk seperti data yang terabaikan karena jarang digunakan. Data tentang mahasiswa yang lulus dapat memberikan informasi yang berguna jika dimanfaatkan dengan maksimal. Maka dari itu, penelitian ini akan memanfaatkan data tentang mahasiswa yang lulus dengan mengolahnya menggunakan data mining untuk mendapatkan informasi berupa prediksi kelulusan mahasiswa. Metode yang akan digunakan adalah metode pohon keputusan yang dibangun dengan algoritma C4.5 disertai dengan algoritma error-based pruning untuk proses pemotongan pohon keputusan. Kriteria yang akan digunakan adalah jenis kelamin, asal daerah, IPK, dan TOEFL. Dalam penerapannya, algoritma C4.5 dapat digunakan untuk menghasilkan prediksi kelulusan dengan nilai rata-rata precision 63.93%, recall 60.73%, dan akurasi 60.52%. Setelah pohon keputusan dipotong dengan menggunakan metode error-based pruning, didapatkan hasil yang lebih baik. Pohon yang dipotong dengan menggunakan nilai confidence 0,4 menghasilkan precision 70.70%, recall 50.65%, dan akurasi 61.57%. Sedangkan pohon yang dipotong dengan menggunakan nilai confidence 0,25 menghasilkan precision 73.77%, recall 48.84%, dan akurasi 62.44%.

Keywords

data mining; kelulusan mahasiswa; pohon keputusan; C4.5; error-based pruning

References

S. D. Jadhav and H. Channe, "Comparative Study of K-NN, Naive Bayes and Decision Tree Classification Techniques," International Journal of Science and Research (IJSR), vol. 5, no. 1, pp. 1842-1845, January 2016.

M. Mohankumar, S. Amuthakkani and G. Jeyamala, "Comparative Analysis of Decision Tree Algorithms for The Prediction of Eligibility of A Man for Availing Bank Loan," International Journal of Advanced Research in Biology Engineering Science and Technology (IJARBEST), vol. 2, no. 15, pp. 360-366, 2016.

D. H. Kamagi, "Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa," ULTIMATICS, vol. VI, no. 1, pp. 15-20, Juni 2014.

V. Anggresta, "Analisis Faktor-faktor yang Mempengaruhi Belajar Mahasiswa Fakultas Ekonomi Universitas Negeri Padang," Journal of Economic and Economic Education, vol. 4, pp. 19-29, 2015.

M. Devinta, "Fenomena Culture Shock (Gegar Budaya) pada Mahasiswa Perantauan di Yogyakarta," Jurnal Pendidikan Sosiologi, 2015.

Y. Kusnia, "Pengaruh Karakteristik Gender dan Motivasi Belajar terhadap Prestasi Belajar Matematika Siswa Kelas X IPA 1 di MAN 2 Semarang," 2017.

J. E. Carson, P. L. Carrell, S. Silberstein, B. Kroll and P. A. Kuehn, "Reading-Writing Relationships in First and Second Language," TESOL Quarterly, vol. 24, pp. 245-266, 1990.

A. Saifudin and R. S. Wahono, "Pendekatan Level Data untuk Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software," Journal of Software Engineering, vol. 1, pp. 76-85, 2015.

K. Grabczewski, Meta-Learning in Decision Tree Induction, Springer, 2014.

J. R. Quinlan, C4.5: Programs for Machine Learning, San Mateo: Morgan Kauffman, 1993.

J. Han, M. Kamber and J. Pei, Data Mining: Concepts and Techniques, 3rd ed., Waltham: Elsevier Inc., 2014.

Article Metrics

Abstract view(s): 7006 time(s)
PDF (Bahasa Indonesia): 4536 time(s)

Refbacks

  • There are currently no refbacks.