KOMPARASI ALGORITMA MACHINE LEARNING DAN DEEP LEARNING UNTUK NAMED ENTITY RECOGNITION : STUDI KASUS DATA KEBENCANAAN
Keywords:
named entity recognition, disaster, machine learning, deep learningAbstract
Penelitian ini bertujuan untuk melakukan Named Entity Recognition guna mengidentifikasi dan mengklasifikasi kata pada tweet yang memuat informasi bencana ke dalam entitas-entitas yang telah ditentukan. Entitas yang diidentifikasi yaitu jenis bencana, lokasi, waktu, magnitude dan others. Adapun algoritma klasifikasi yang digunakan adalah Machine Learning dan Deep Learning. Algoritma Deep Learning yang digunakan yaitu Long Short-Term Memory, Gated Recurrent Units, dan Convolutional Neural Network. Sedangkan algoritma Machine Learning yang digunakan yaitu Naïve Bayes, Decision Tree, Support Vector Machine dan Random Forest. Berdasarkan hasil eksperimen, Deep Learning memperoleh akurasi yang lebih unggul dari Machine Learning. Hal tersebut dilihat dari perolehan nilai accuracy terbaik Deep Learning dihasilkan dari algoritma Gated Recurrent Units dan Long Short-Term Memory dengan nilai 0.999. Sedangkan perolehan accuracy terbaik Machine Learning dihasilkan dari algoritma Random Forest sebesar 0.98.
References
[2] J. An, M. Cha, K. Gummadi, and J. Crowcroft, “Media landscape in Twitter: A world of new conventions and political diversity,†Assoc. Adv. Artificial Intell., pp. 18–25, 2011.
[3] H. Februariyanti, E. Zuliarso, D. Bulan, and L. Suryati, Rancang bangun sistem layanan informasi bencana melalui twitter menggunakan basis data xml, vol. 035, no. November. 2013.
[4] Z. Ashktorab, C. Brown, M. Nandi, and A. Culotta, “Tweedr: Mining Twitter to Inform Disaster Response,†Proc. 11th Int. ISCRAM Conf., vol. 12, no. 4, pp. 354– 358, 2014.
[5] A. F. Hidayatullah, “Analisis Sentimen dan Klasifikasi Kategori Terhadap Tokoh Publik Pada Twitter,†TESIS, vol. 2014, no. semnasIF, p. A-1, 2014.
[6] L. Derczynski et al., “Analysis of named entity recognition and linking for tweets,†Inf. Process.Manag., vol. 51, no. 2, pp. 32–49, 2015.
[7] Y. Wibisono and M. L. Khodra, “Pengenalan Entitas Bernama Otomatis untuk Bahasa Indonesia dengan Pendekatan Pembelajaran Mesin,†pp. 1–5, 2018.
[8] Jan Wira Gotama Putra, “Pengenalan Konsep Pembelajaran Mesin dan Deep Learning,†2017.
[9] Bustami, “Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi,†TECHSI J. Penelit. Tek.Inform., vol. 8, no. 1, 2014.
[10]P. Kasih, “Pemodelan Data Mining Decision Tree Dengan Classification Error Untuk Seleksi Calon Anggota Tim Paduan Suara,†vol. 2, pp. 63–69, 2019.
[11]A. Andriani, “Sistem Prediksi Penyakit Diabetes Berbasis Decision Tree,†Bianglala Inform., vol. 1, no. 1, pp. 1–10, 2013.
[12] V. Rodriguez-Galiano, M. Sanchez-Castillo, M. Chica-Olmo, and M. Chica-Rivas, “Machine learning predictive models for mineral prospectivity: An evaluation of neural networks, random forest, regression trees and support vector machines,†Ore Geol. Rev., vol. 71, pp. 804–818, 2015.
[13]V. Sazonau, “Implementation and Evaluation of a Random Forest Machine Learning Algorithm,†Univ. Manchenster, p. 9, 2012.
[14]E. Scornet, “Random forests and kernel methods,†IEEE Trans. Inf. Theory, vol. 62, no. 3, pp. 1485–1500, 2016.
[15]A. Liaw and M. Wiener, “Classification and Regression by randomForest,†R News, vol. 2, no. 3, pp. 18–22, 2002.
[16]W. Widayat, “PENGARUH WORD EMBEDDING DIMENSION REDUCTION TERHADAP KINERJA LSTM UNTUK ANALISIS SENTIMEN,†2018.
[17]A. Ahmad, “Mengenal Artificial Intelligence, Machine Learning, Neural Network, dan Deep Learning,†J. Teknol. Indones., no. October, p. 3, 2017.
[18] R. A. N. Nayoan, “ANALISIS SENTIMEN BERBASIS FITUR PADA ULASAN TEMPAT WISATA MENGGUNAKAN METODE CONVOLUTIONAL NEURAL NETWORK(CNN),†2019.
[19]R. Dermawan, “Klasifikasi Tweet Dan Pengenalan Entitas Bernama Pada Tweet Bencana Dengan Support Vector Machine,†입법학연구, vol. ì œ 13 집 1호, pp. 31–48, 2016
[20]B. M. Dela Cruz, C. Montalla, A. Manansala, R. Rodriguez, M. Octaviano, and B. S. Fabito, “Named-Entity Recognition for Disaster Related Filipino News Articles,†TENCON 2018 - 2018 IEEE Reg. 10 Conf., no. October, pp. 1633–1636, 2018
[21]M. N. Saadah, R. W. Atmagi, D. S. Rahayu, and A. Z. Arifin, “Sistem Temu Kembali Dokumen Teks Dengan Pembobotan Tf-Idf Dan LCS,†JUTI J. Ilm. Teknol.Inf., vol. 11, no. 1, p. 19, 2013.
[22]A. Gholamy, V. Kreinovich, and O. Kosheleva, “Why 70 / 30 or 80 / 20 Relation Between Training and Testing Sets : A Pedagogical Explanation,†pp. 1–6.
[23]R. De Groot, “Data Mining for Tweet Sentiment Classification,†p. 63, 2012.
[24]L. Mutawalli, M. T. A. Zaen, and W. Bagye, “Klasifikasi Teks Sosial Media Twitter Menggunakan Support Vector Machine (Studi Kasus Penusukan Wiranto),†JIRE (Jurnal Inform. dan Rekayasa Elektron., vol. 2, no. 2, pp. 43–51, 2019.
[25] Fadli, S., Ashari, M., & Imtihan, K. (2020). SISTEM PENJADWALAN EVENT ORGANIZER DENGAN METODE ROUND ROBIN (RR). Jurnal Manajemen Informatika dan Sistem Informasi, 3(2), 100-107.
[26]Imtihan, K., & Fahmi, H. (2020). ANALISIS DAN PERANCANGAN SISTEM INFORMASI DAERAH RAWAN KECELAKAAN DENGAN MENGGUNAKAN GEOGRAPHIC INFORMATION SYSTEMS (GIS). Jurnal Manajemen Informatika dan Sistem Informasi, 3(1), 16-23.
Downloads
Published
How to Cite
Issue
Section
License
Semua tulisan pada jurnal ini menjadi tanggungjawab penuh penulis.