Algoritma Komputasi Machine Learning untuk Aplikasi Prediksi Nilai Total Organic Carbon (TOC)
DOI:
https://doi.org/10.29017/LPMGB.55.2.606Kata Kunci:
TOC, machine learning, cross validation, hyperparameter tuningAbstrak
Total Organic Carbon (TOC) merupakan salah satu parameter penting yang digunakan untuk mengevaluasi kemampuan source rock secara kuantitas. Pada umumnya, data TOC diperoleh melalui core yang kemudian dilakukan proses pirolisis rock-eval pada setiap perconto. Namun, proses tersebut memerlukan waku yang cukup lama dan biaya yang cukup besar sehingga data yang didapatkan jumlahnya terbatas. Hal ini akan berimplikasi terhadap validitas penyebaran nilai TOC pada tahapan eksplorasi batuan induk unkonvensional. Data yang terbatas dapat diprediksi dengan pendekatan pola karakterisitik data itu sendiri. Penelitian ini dilakukan bertujuan untuk melakukan prediksi nilai TOC dengan menggunakan algoritma machine learning yaitu Artificial Neural Network, K-Nearest Neighbors, Support Vector Regression, Decision Tree, dan Random Forest dengan memanfaatkan data sumur “A†untuk membangun model dari setiap algoritma machine learning dan data sumur “B†untuk mengevaluasi model yang telah dibangun berdasarkan data sumur “Aâ€. Pengolahan data untuk memprediksi nilai TOC dimulai dari mempersiapkan data pada sumur “A†berdasarkan korelasi yang tinggi pada prediktor dan data output yang akan diprediksi. Selanjutnya dilakukan pembagian atau splitting datasets dengan presentase 60% data digunakan untuk melakukan training dan 40% data sebagai test datasets. Setelah itu, train datasets dapat digunakan untuk membangun model algoritma machine learning. Kemudian dilakukan hyperparameter tuning dan cross validation sehingga dapat dihasilkan model algoritma machine learning dengan hyperparameter tertentu dengan hasil prediksi yang konsisten. Model terbaik diperoleh berdasarkan hasil cross validation dengan menggunakan prediktor dari test datasets hasil splitting sumur “A†dan test datasets dari sumur baru “Bâ€. Hasil penelitian menunjukan bahwa hasil prediksi TOC terbaik pada data sumur “A†diperoleh dengan menggunaan algoritma Random Forest dan pada sumur “B†menggunakan algoritma K-Nearest Neighbors.
Referensi
Alasadi, S. & Bhaya, W., 2017. Review of Data Preprocessing Techniques in Data Mining. Journal of Engineering and Applied Sciences, 12(16), pp. 4102-4107.
Breiman, L., 2001. Random Forests. Machine Learning, Volume 45, p. 5–32.
Catani, F., Lagomarsino, D., Segoni, S. & Tofani, V., 2013. Landslide Susceptibility Estimation by Random Forests Technique: Sensitivity and Scaling Issues. Natural Hazards and Earth System Sciences, 13(11), pp. 2815-2831.
Cortes, C. & Vapnik, V., 1995. Support-Vector Networks. Machine Learning, Volume 20, p. 273–297.
Isiyaka, H. A., Mustapha, A., Juahir, H. & Phil-Eze, P., 2019. Water Quality Modelling Using Artificial Neural Network and Multivariate Statistical Techniques. Modeling Earth Systems and Environment, Volume 5, p. 583–59.
Kleynhans, T., Montanaro, M., Gerace, A. & Kanan, C., 2017. Predicting Top-of-Atmosphere Thermal Radiance Using MERRA-2 Atmospheric Data with Deep Learning. Remote Sensing, 9(11), p. 1133.
Kuhn, M. & Johnson, K., 2013. Applied Predictive Modeling. New York: Springer.
Kumar, A., 2003. Neural Network Based Detection of Local Textile Defects. Pattern Recognition, 36(7), pp. 1645-1659.
Mitchell, T. M., 1997. Machine Learning:McGraw Hill.
Peters, K. & Cassa, M. R., 1994. Applied Source Rock Geochemistry: Chapter 5: Part II. Essential Elements. In: The Petroleum System--From Source to Trap :AAPG Special Volumes, pp. 93-120.
Schölkopf, B. & Smola, A. J., 2002. Learning With Kernels. Cambridge: MIT Press.
Shmueli, G., Patel, N. R. & Bruce, P. C., 2016. Data Mining for Business Intelligence: Concepts. India: Techniques and Applications Wiley.
Wang, H., Wu, W., Chen, T., Dong, X., & Wang,G., 2019. An Improved Neural Network for TOC, S1 and S2 Estimation based on Conventional Well Logs. Journal of Petroleum Science and Engineering, Volume 176, pp. 664-678.
Wang, L.-J., Guo, M., Sawada, K., Lin, J., & Zhang, J., 2016. A Comparative Study of Landslide Susceptibility Maps using Logistic Regression, Frequency Ratio, Decision Tree, Weights of Evidence and Artificial Neural Network. Geosciences Journal, Volume 20, p. 117-136.