Optimization of cross-validation testing on the decision tree and k-nearest neighbor in classifying election data

Desilia Selvida; Purwa Hasan Putra

doi:10.35335/mantik.v7i2.3999

pdf

Published: Nov 8, 2023

DOI: https://doi.org/10.35335/mantik.v7i2.3999

Keywords:

Classifieds, Cross Validation’ Decision Tree, Election Data, K-Nearest Neighbor

Issue

Vol. 7 No. 3 (2023): November: Manajemen, Teknologi Informatika dan Komunikasi (Mantik)

Section

Computer Science

Statistics Article

Article View : 143 Times

Desilia Selvida

Universitas Sumatera Utara, Indonesia

Purwa Hasan Putra

Politeknik Negeri Medan, Indonesia

Abstract

General elections are the process of choosing someone who represents the people to occupy a government seat. Polemics regarding the postponement of the 2024 General Elections are widely discussed by Indonesian people. However, the fact is that the position of the government (executive) is currently the majority. This condition is caused by the support of a strong party coalition in the legislature (parliament) in a presidential system. This problem can be solved by data mining. Data mining is one way that can be used to predict and detect a case, including predicting the winning party. There are various kinds of algorithms. The results of the study are positive value predictions (class precision), namely 94.88% with 19 data suitability and 352 data discrepancies, for negative value predictions, namely 60.42% with 29 data suitability and 19 data discrepancies. Meanwhile, the true negative class recall was 94.88% and the true positive was 60.42%. The results of the accuracy of testing with a decision tree is 90.92%. While the results of the K-Nearest Neighbor optimization, it is known that the prediction of positive value (class precision) is 93.98% with 23 data suitability and 352 data discrepancy, for negative prediction value is 67.57% with 25 data suitability and 12 data discrepancy. While the true negative class recall was 96.77% and true positive was 52.08%. The results of the accuracy of testing with a decision tree is 91.65%.

Downloads

Download data is not yet available.

How to Cite

Selvida, D. and Hasan Putra, P. (2023) “Optimization of cross-validation testing on the decision tree and k-nearest neighbor in classifying election data”, Jurnal Mantik, 7(3), pp. 1623-1632. doi: 10.35335/mantik.v7i2.3999.

References

Az-zahra, A. A., Marsaoly, A. F., Lestyani, I. P., Salsabila, R., & Madjida, W. O. Z. (2021). Penerapan Algoritma K-Modes Clustering Dengan Validasi Davies Bouldin Index Pada Pengelompokkan Tingkat Minat Belanja Online Di Provinsi Daerah Istimewa Yogyakarta. Jurnal MSA ( Matematika Dan Statistika Serta Aplikasinya ), 9(1), 24. https://doi.org/10.24252/msa.v9i1.18555
Azis, H., Purnawansyah, P., Fattah, F., & Putri, I. P. (2020). Performa Klasifikasi K-NN dan Cross Validation Pada Data Pasien Pengidap Penyakit Jantung. ILKOM Jurnal Ilmiah, 12(2), 81–86. https://doi.org/10.33096/ilkom.v12i2.507.81-86
Badrul, M., Studi, P., & Informasi, S. (2015). Prediksi Hasil Pemilu Legislatif Dengan Menggunakan Algoritma K-Nearest Neighbor. Jurnal Pilar Nusa Mandiri, 11(2), 152–160.
Dollen, D. Von, Neukart, F., Weimer, D., & Bäck, T. (2023). Predicting vehicle prices via quantum ? assisted feature selection. International Journal of Information Technology. https://doi.org/10.1007/s41870-023-01370-z
Estian Pambudi, R., Sriyanto, & Firmansyah. (2022). Klasifikasi Penyakit Stroke Menggunakan Algoritma Decision TreeC.45. Ijccs, x, No.x(x), 1–5.
Fauzi, A., & Yunial, A. H. (2022). JEPIN (Jurnal Edukasi dan Penelitian Informatika) Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K-Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset. (JEPIN) Jurnal Edukasi Dan Penelitian Informatika, 8(3), 470–481.
FUADAH, Y. N., UBAIDULLAH, I. D., IBRAHIM, N., TALININGSING, F. F., SY, N. K., & PRAMUDITHO, M. A. (2022). Optimasi Convolutional Neural Network dan K-Fold Cross Validation pada Sistem Klasifikasi Glaukoma. ELKOMIKA: Jurnal Teknik Energi Elektrik, Teknik Telekomunikasi, & Teknik Elektronika, 10(3), 728. https://doi.org/10.26760/elkomika.v10i3.728
Hasan Putra, P., Syahputra Novelan, M., & Rizki, M. (2022). Analysis K-Nearest Neighbor Method in Classification of Vegetable Quality Based on Color. Journal of Applied Engineering and Technological Science, 3(2), 126–132.
Jimmy, Hermaliani, E. H., & Kurniawati, L. (2023). Analisis Klasifikasi Sentimen Pengguna Media Sosial Twitter Terhadap Penundaan Pemilu Presiden Tahun 2024. Jurnal Indonesia?: Manajemen Informatika Dan Komunikasi, 4(2), 570–579. https://doi.org/10.35870/jimik.v4i2.243
Karo, I. M. K., Huda, A. F., & MaulanaAdhinugraha, K. (2018). A cluster validity for spatial clustering based on davies bouldin index and Polygon Dissimilarity function. Proceedings of the 2nd International Conference on Informatics and Computing, ICIC 2017, 2018-Janua, 1–6. https://doi.org/10.1109/IAC.2017.8280572
Mardiana, L., Kusnandar, D., & Satyahadewi, N. (2022). Analisis Diskriminan Dengan K Fold Cross Validation Untuk Klasifikasi Kualitas Air Di Kota Pontianak. Buletin Ilmiah Mat. Stat. Dan Terapannya (Bimaster), 11(1), 97–102.
Martini, M., Anwar, R. S., & Masshitah, S. (2022). Analisa Decision Tree Untuk Menentukan Jadwal Kerja Karyawan Restoran Pada Hari Libur. JURNAL PETISI (Pendidikan Teknologi Informasi), 3(1), 5–14. https://doi.org/10.36232/jurnalpetisi.v3i1.2041
Prasetyo, A. B., & Laksana, T. G. (2022). Optimasi Algoritma K-Nearest Neighbors dengan Teknik Cross Validation Dengan Streamlit (Studi Data: Penyakit Diabetes). Journal of Applied Informatics and Computing (JAIC), 6(2), 194. http://jurnal.polibatam.ac.id/index.php/JAIC
Purwani, F., Wahyudi, R. T., & Jaya, I. D. (2022). Penerapan Algoritma K-Nearest Neighbor dengan Euclidean Distance untuk Menentukan Kelompok Uang Kuliah Tunggal Mahasiswa. Edumatic: Jurnal Pendidikan Informatika, 6(2), 344–353. https://doi.org/10.29408/edumatic.v6i2.6547
Putra, P. H., Purba, B., & Dalimunthe, Y. A. (2023). Random forest and decision tree algorithms for car price prediction. 1(2), 81–89.
Rahayu, W. I., Anindita, A., & Fauzan, M. N. (2022). PENENTUAN VALIDASI DATA PEMILIH DAN KLASIFIKASI HASIL PEMILU DPRD KAB.BONE UNTUK MEMPREDIKSI PARTAI PEMENANG MENGGUNAKAN METODE NAIVE BAYES Program Studi D4 Teknik Informatika 123 Politeknik Pos Indonesia 123. Jurnal Teknik Informatika, 14(1), 32–39.
Robianto?; Sampe Hotlan Sitorus?; Uray Ristian. (2021). Penerapan Metode Decision Tree Untuk Mengklasifikasikan Mutu Buah Jeruk BerdasarkanFitur Warna Dan Ukuran. Jurnal Komputer Dan Aplikasi, 9(01), 76–86.
Salasa, S. A., & Maharani, W. (2022). Personality Detection of Twitter Social Media Users using the Support Vector Machine Method. Jurnal Sistem Komputer Dan Informatika (JSON), 4(2), 263. https://doi.org/10.30865/json.v4i2.5345
Samponu, Y. B., & Kusrini, K. (2018). Optimasi Algoritma Naive Bayes Menggunakan Metode Cross Validation Untuk Meningkatkan Akurasi Prediksi Tingkat Kelulusan Tepat Waktu. Jurnal ELTIKOM, 1(2), 56–63. https://doi.org/10.31961/eltikom.v1i2.29
Solehuddin, M., Syafei, W. A., & Gernowo, R. (2022). Metode Decision Tree untuk Meningkatkan Kualitas Rencana Pelaksanaan Pembelajaran dengan Algoritma C4.5. Jurnal Penelitian Dan Pengembangan Pendidikan, 6(3), 510–519. https://doi.org/10.23887/jppp.v6i3.52840
Triyansyah, D., & Fitrianah, D. (2018). Analisis Data Mining Menggunakan Algoritma K-Means Clustering Untuk Menentukan Strategi Marketing. Jurnal Telekomunikasi Dan Komputer, 8(3), 163. https://doi.org/10.22441/incomtech.v8i3.4174
Tuntun, R., Kusrini, K., & Kusnawi, K. (2022). Analisis Perbandingan Kinerja Algoritma Klasifikasi dengan Menggunakan Metode K-Fold Cross Validation. Jurnal Media Informatika Budidarma, 6(4), 2111. https://doi.org/10.30865/mib.v6i4.4681
Zarti, M. N., Sahputra, E., Sonita, A., & ... (2023). Application Of Data Mining Using The Naïve Bayes Classification Method To Predict Public Interest Participation In The 2024 Elections. Jurnal Komputer …, 3(1), 105–114. https://penerbitadm.com/index.php/KOMITEK/article/view/1192%0Ahttps://penerbitadm.com/index.php/KOMITEK/article/download/1192/1648
Zulaikhah Hariyanti Rukmana, S., Aziz, A., & Harianto, W. (2022). Optimasi Algoritma K-Nearest Neighbor (Knn) Dengan Normalisasi Dan Seleksi Fitur Untuk Klasifikasi Penyakit Liver. JATI (Jurnal Mahasiswa Teknik Informatika), 6(2), 439–445. https://doi.org/10.36040/jati.v6i2.4722

Copyright and Licensing

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

Article Sidebar

Main Article Content

Abstract

Downloads

Article Details