RANGKING INDEKS BERITA LARANGAN MUDIK PADA PORTAL MEDIA ONLINEDENGAN METODE TF-IDF DAN COSINE SIMILARITY MENGGUNAKAN MACHINE LEARNING

Authors

  • Muhammad Syahrani Universitas Nusa Mandiri
  • Kusnadi - Kusnadi Universitas Nusa Mandiri
  • Bambang Joko Triwibowo Universitas Nusa Mandiri
  • Yusuf Arif Setiawan Universitas Nusa Mandiri
  • Fariszal Nova Arviantino Universitas Nusa Mandiri
  • Didi Rosiyadi Universitas Nusa Mandiri

DOI:

https://doi.org/10.36595/misi.v5i1.500

Keywords:

data mining, informasi retrieval, vector space mode, TF-IDF, cosine similarity

Abstract

Usaha pemerintah Indonesia dalam pencegahan penyebaran virus Covid 19 dengan dikeluarkannya peraturan yang diterapkan sampai tingkat daerah. Dan tradisi tahunan masyarakat Indonesia mudik lebaran 2021 telah dilarang. Opini berita tentang pelarangan mudik lebaran baik dimedia cetak maupun media online dan dimedia sosialpun ramai diperbincangkan, tentu masyarakat yang akan mudik merasakan kebingungan dengan pemberitaan tersebut dan belum mengetahui kapan dan sampai kapan diberlakukan. Hal ini peneliti bereksperimen mengumpulkan berita-berita yang ada di portal media online. Kumpulan berita tersebut dijadikan dataset, selanjutnya dilakukan preprocessing meliputi tahapan tokenizing, filtering dan stemming. Pencarian informasi berita yang akurasi dapat menggunakan algoritma vector space model dengan menghitung TF IDF dan cosine similarity pada setiap judul berita (dokumen) dan pada paper ini peneliti dengan menggunakan machine learning. Dataset yang digunakan 5 judul berita yang masing-masing diberi label D1, D2, D3, D4, dan D5. Hasil penelitian menunjukan bahwa rangking indek berita larangan mudik yang paling tinggi terdapat pada dokumen 5(D5) dengan skor 0,612. Hasil tersebut menguatkan akan tujuan penelitian yaitu untuk mengetahui keyword yang cocok digunakan agar dapat memperoleh berita yang relevan dan sesuai keinginan dengan menghitung dan merangking hasil nilai cosine similarity.

References

N. Suwela, “Ranking Index Berita New Normal dengan Metode Information Retrieval Menggunakan Vector Space Model,” STRING (Satuan Tulisan Ris. dan Inov. Teknol., vol. 5, no. 1, p. 61, 2020, doi: 10.30998/string.v5i1.6479.

K. D. N. RI, “Instruksi Mendagri No.17 tahun2021 ttg PPKM Berbasis mikro dan Mengoptimalkan Posko Penanganan Corona Virus Disease 2019 Di Tingkat Desa dan Kelurahan Untuk Pengendalian Penyebaran Corona Virus Disease 2019,” pp. 1–19, 2021.

Satuan Tugas Penanganan Covid-19, “Peniadaan Mudik Hari Raya Idul Fitri Tahun 1442 Hijriah Dan Upaya Pengendalian Penyebaran Corona Virus Disease 2019 (Covid-19) Selama Bulan Suci Ramadhan 1442 Hijriah,” Satgas Covid -19. p. 1, 2021, [Online]. Available: https://covid19.go.id/.

P. T. Dan and R. Logistik, “Analisis Sentimen Twitter tentang Covid-19 Menggunakan Istilah,”, Seminar Internasional Teknologi Informasi (ITIS) 2020 Surabaya, Indonesia, 14-16 Oktober 2020, pp. 14–16, 2021.

E. D. Sikumbang, “Penerapan Data Mining Penjualan Sepatu Menggunakan Metode Algoritma Apriori,” J. Tek. Komput. AMIK BSI, vol. Vol 4, No., no. September, pp. 1–4, 2018.

D. Game and O. Pada, “Vector space model,” Prosiding SNST ke-7 Tahun 2016, pp. 73–78, 2016.

A. A. Abdillah and I. B. Muktyas, “Implementasi vector space model untuk pencarian dokumen,” no. May 2013, 2015.

F. Amin, “Implementasi Search Engine (Mesin Pencari) Menggunakan Metode Vector Space Model,” J. Ilm. Din. Tek., vol. 5, no. 1, pp. 45–58, 2011.

H. Yuan, Y. Tang, W. Sun, and L. Liu, “A detection method for android application security based on TF-IDF and machine learning,” PLoS One, vol. 15, no. 9 September, pp. 1–19, 2020, doi: 10.1371/journal.pone.0238694.

O. Shahmirzadi, A. Lugowski, and K. Younge, “Text Similarity in Vector Space Models?:,” pp. 659–666, 2019, doi: 10.1109/ICMLA.2019.00120.

Y. Alkhalifi, W. Gata, A. Prasetyo, and I. Budiawan, “Analisis Sentimen Penghapusan Ujian Nasional pada Twitter Menggunakan Support Vector Machine dan Naïve Bayes berbasis Particle Swarm Optimization,” vol. 6, no. 2, pp. 71–78, 2020.

D. Sari, “Latent Semantic Indexing for Indonesian Text Similarity, International Journal of Engineering & Technology, pp.1-6, vol.7.2018”

J. Wang, “Text Similarity Calculation Method Based on Hybrid Model of LDA and TF-IDF,” pp. 1–8, 2019.

A. Riyani, M. Zidny, and A. Burhanuddin, “Penerapan Cosine Similarity dan Pembobotan TF-IDF untuk Mendeteksi Kemiripan Dokumen,” vol. 2, no. 1, pp. 23–27, 2019.

S. Wahyunita, Y. Azhar, and N. Hayatin, “Analisa Sentimen Tweet Berbahasa Indonesia dengan Menggunakan Metode Pembobotan Hybrid TF-IDF pada Topik Transportasi Online,” J. Repos., vol. 2, no. 2, p. 185, 2020, doi: 10.22219/repositor.v2i2.238.

G. Vinodhini and R. Chandrasekaran, “Sentiment Analysis and Opinion Mining?: A Survey International Journal of Advanced Research in Sentiment Analysis and Opinion Mining?: A Survey,” Int. J. Adv. Res. Comput. Sci. Softw. Eng., vol. 2, no. 6, pp. 283–292, 2012.

M. Nurjannah and I. Fitri Astuti, “Penerapan Algoritma Term Frequency-Inverse Document Frequency (TF-IDF) Untuk Text Mining Mahasiswa S1 Program Studi Ilmu Komputer FMIPA Universitas Mulawarman Dosen Program Studi Ilmu Komputer FMIPA Universitas Mulawarman,” J. Inform. Mulawarman, vol. 8, no. 3, pp. 110–113, 2013.

A. Wibawa and U. Pujianto, “Cosine Similarity for Title and Abstract of Economic Journal Classification,” no. July, 2020, doi: 10.1109/ICSITech46713.2019.8987547.

B. Kelly and M. Taddy, “Measuring Technological Innovation over the Long Run ?,” no. January, 2020.

G. Karyono, F. S. Utomo, A. Sistem, and T. Balik, “Temu Balik Informasi Pada Dokumen Teks Berbahasa Indonesia Dengan Metode Vector Space Retrieval Model,” Semin. Nas. Teknol. Inf. dan Terap. 2012, vol. 2012, no. Semantik, pp. 282–289, 2012.

D. Susandi and U. Sholahudin, “Pemanfaatan Vector Space Model pada Penerapan Algoritma Nazief Adriani , KNN dan Fungsi Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks Bahasa Indonesia,” J. ProTekInfo, vol. 3, no. 1, pp. 22–29, 2016.

H. Kim and J. Baek, “applied sciences Optimization of Associative Knowledge Graph Using TF-IDF Based Ranking Score,” 2020.

Imtihan, K., & Fahmi, H. (2020). Analisis Dan Perancangan Sistem Informasi Daerah Rawan Kecelakaan Dengan Menggunakan Geographic Information Systems (GIS). Jurnal Manajemen Informatika dan Sistem Informasi, 3(1), 16-23.

Imtihan, K., & Basri, M. H. (2019). Sistem Informasi Pembuatan Manifest Muatan Kapal Berbasis Dekstop Dan Android. Jurnal Manajemen Informatika dan Sistem Informasi, 2(2), 69-76.

Ashari, M., Zaen, M. T. A., Putri, J. A., Imtihan, K., & Bagye, W. (2022). Prototype Sterilisasi Virus Barang Belanjaan Online Berbasis Arduino. Jurnal Media Informatika Budidarma, 6(1), 120-127.

Downloads

Published

11-02-2022