ANALISIS EFEKTIVITAS TEKNIK IMPUTASI PADA LSTM UNTUK MENINGKATKAN KUALITAS DATA PADA PERAMALAN CURAH HUJAN

Authors

DOI:

https://doi.org/10.36595/jire.v7i2.1172

Keywords:

LSTM, LOCF, KNN, NOCB, MICE

Abstract

Data pemantauan iklim yang didapatkan dari stasiun meteorologi dapat memiliki missing value karena berbagai hal. Ketidaklengkapan data dapat terjadi karena transmisi gagal, sensor tidak merespons, perbaikan perangkat, dan lain-lain. Masalah yang didapati umumnya adalah data tidak konsisten dan adanya noise pengukuran data iklim. Diperlukan solusi penanganan missing values pada data cuaca agar dapat diatasi sebelum dilakukan analisis lebih lanjut. Penelitian ini mengusulkan penerapan data imputation pada fase data preparation menyesuaikan karakteristik data. Metode forecasting yang diterapkan adalah LSTM dan Bidirectional LSTM yang merupakan turunan dari RNN. Metode ini menghasilkan model dari data time series yang lebih baik dibanding RNN. Hasil penelitian menyimpulkan metode imputasi yang memiliki performa terbaik adalah KNN dipadukan dengan metode Bidirectional LSTM. Nilai evaluation metric yang diperoleh adalah Mean Absolute Error (MAE) sebesar 3,3599, Mean Square Error (MSE) sebesar 78,4336, Root Mean Squared Error (RMSE) sebesar 8,8562 dan R-Squared sebesar 0,5365.

References

S. Nikfalazar, C.-H. Yeh, S. Bedingfield, and H. A. Khorshidi, “Missing data imputation using decision trees and fuzzy clustering with iterative learning,” Knowl. Inf. Syst., vol. 62, pp. 2419–2437, 2020.

W. Lan, X. Chen, T. Zou, and C.-L. Tsai, “Imputations for high missing rate data in covariates via semi-supervised learning approach,” J. Bus. & Econ. Stat., vol. 40, no. 3, pp. 1282–1290, 2022.

M. Alabadla et al., “Systematic Review of Using Machine Learning in Imputing Missing Values,” IEEE Access, vol. 10, pp. 44483–44502, 2022, doi: 10.1109/ACCESS.2022.3160841.

M. Alabadla et al., “Systematic Review of Using Machine Learning in Imputing Missing Values,” IEEE Access, vol. 10, pp. 44483–44502, 2022, doi: 10.1109/ACCESS.2022.3160841.

C. Chatfield, The analysis of time series: An introduction. Chapman & Hall/CRC, 2003.

J. F. Torres, D. Hadjout, A. Sebaa, F. Martínez-Álvarez, and A. Troncoso, “Deep Learning for Time Series Forecasting: A Survey,” Big Data, vol. 9, no. 1, pp. 3–21, 2021, doi: 10.1089/big.2020.0159.

J. F. Torres, A. Galicia, A. Troncoso, and F. Martínez-Álvarez, “A scalable approach based on deep learning for big data time series forecasting,” Integr. Comput. Aided. Eng., vol. 25, no. 4, pp. 335–348, 2018, doi: 10.3233/ICA-180580.

N. H. A. Rahman, M. Z. Hussin, S. I. Sulaiman, M. A. Hairuddin, and E. H. M. Saat, “Univariate and multivariate short-term solar power forecasting of 25MWac Pasir Gudang utility-scale photovoltaic system using LSTM approach,” Energy Reports, vol. 9, no. S11, pp. 387–393, 2023, doi: 10.1016/j.egyr.2023.09.018.

F. Wang, Z. Xuan, Z. Zhen, K. Li, T. Wang, and M. Shi, “A day-ahead PV power forecasting method based on LSTM-RNN model and time correlation modification under partial daily pattern prediction framework,” Energy Convers. Manag., vol. 212, p. 112766, 2020, doi: https://doi.org/10.1016/j.enconman.2020.112766.

W. Yu, G. Liu, L. Zhu, and W. Yu, “Convolutional neural network with feature reconstruction for monitoring mismatched photovoltaic systems,” Sol. Energy, vol. 212, pp. 169–177, 2020, doi: https://doi.org/10.1016/j.solener.2020.09.026.

E. Afrifa-Yamoah, U. A. Mueller, S. M. Taylor, and A. J. Fisher, “Missing data imputation of high-resolution temporal climate time series data,” Meteorol. Appl., vol. 27, no. 1, p. e1873, 2020.

K. Auliasari and M. Kertaningtyas, “ANALISIS KUALITAS UDARA MENGGUNAKAN ALGORITMA K-MEANS,” J. Inform. dan Rekayasa Elektron., vol. 4, no. 2, pp. 95–105, 2021.

A. S. Handayani, S. Soim, T. E. Agusdi, R. Rumiasih, and A. Nurdin, “Klasifikasi Kualitas Udara Dengan Metode Support Vector Machine,” J. Inform. dan Rekayasa Elektron., vol. 3, no. 2, pp. 187–199, 2020.

A. S. Temur, M. Akgün, and G. Temur, “Predicting housing sales in Turkey using ARIMA, LSTM and hybrid models,” 2019.

M. A. Ridla, N. Azise, and M. Rahman, “Perbandingan Model Time Series Forecasting Dalam Memprediksi Jumlah Kedatangan Wisatawan Dan Penumpang Airport,” Simkom, vol. 8, no. 1, pp. 1–14, 2023, doi: 10.51717/simkom.v8i1.103.

P. Nath, P. Saha, A. I. Middya, and S. Roy, “Long-term time-series pollution forecast using statistical and deep learning methods,” Neural Comput. Appl., vol. 33, no. 19, pp. 12551–12570, 2021, doi: 10.1007/s00521-021-05901-2.

D. R. Alghifari, M. Edi, and L. Firmansyah, “Implementasi Bidirectional LSTM untuk Analisis Sentimen Terhadap Layanan Grab Indonesia,” J. Manaj. Inform., vol. 12, no. 2, pp. 89–99, 2022.

R. M. Putra and N. Anjar Rani, “Prediksi Curah Hujan Harian di Stasiun Meteorologi Kemayoran Menggunakan Artificial Neural Network (ANN),” Bul. GAW Bariri, vol. 1, no. 2, pp. 101–108, 2020, doi: 10.31172/bgb.v1i2.35.

I. Ghozali, “Aplikasi Analisis Multivariete dengan Program IBM SPSS 23,” 2016.

Published

2024-11-01