Analisis Perbandingan Decision Tree, Support Vector Machine, dan Xgboost dalam Mengklasifikasi Review Hotel Trip Advisor

Authors

  • Hansen Christanto Universitas Prima Indonesia, Indonesia
  • Julfikar Rahmad Universitas Prima Indonesia, Indonesia
  • Stiven Hamonangan Sinurat Universitas Prima Indonesia, Indonesia
  • Daniel Ryan Hamonangan Sitompul Universitas Prima Indonesia, Indonesia
  • Andreas Sitomorang Universitas Prima Indonesia, Indonesia
  • Dennis Jusuf Ziegel Universitas Prima Indonesia, Indonesia
  • Evta Indra

DOI:

https://doi.org/10.37012/jtik.v9i1.1429

Abstract

Jaringan media sosial pada saat ini terus berkembang dan berdampak pada industri perhotelan. Pelanggan dan traveler telah memposting hasil review secara online untuk menunjukkan tingkat kepuasan mereka terhadap hotel dan berbagi pengalaman terkait hotel yang dikunjungi dengan pelanggan lain yang ada di seluruh belahan dunia. Situs web yang bergerak dalam pariwisata dan perhotelan berkembang pesat secara online seperti Trip advisor. Trip advisor merupakan platform penyedia layanan perjalanan dan pemesanan hotel. Penelitian menggunakan teknik analisis sentimen untuk mengkategorikan opini pengguna yang bernilai negatif maupun positif dengan bantuan kecerdasan buatan yaitu Machine Learning. Penelitian ini menguji tiga algoritma Machine Learning, yaitu Decision Tree Classifier, Support Vector Machine (SVM) dan Xgboost Classifier, dalam melakukan analisis sentimen terhadap review hotel di platform Trip advisor. Hasilnya menunjukkan bahwa Xgboost memiliki tingkat keakuratan (accuracy) yang paling tinggi, mencapai 99%, dibandingkan dengan Decision Tree (97%) dan Support Vector Machine (98%). Dengan demikian, Xgboost dianggap sebagai algoritma terbaik untuk melakukan analisis sentimen pada review hotel di Trip advisor.

 

Author Biographies

Hansen Christanto, Universitas Prima Indonesia

Fakultas Sains dan Teknologi, Program Studi Sistem Informasi

Julfikar Rahmad, Universitas Prima Indonesia

Fakultas Sains dan Teknologi, Program Studi Sistem Informasi

Stiven Hamonangan Sinurat, Universitas Prima Indonesia

Fakultas Sains dan Teknologi, Program Studi Sistem Informasi

Daniel Ryan Hamonangan Sitompul, Universitas Prima Indonesia

Fakultas Sains dan Teknologi, Program Studi Sistem Informasi

Andreas Sitomorang, Universitas Prima Indonesia

Fakultas Sains dan Teknologi, Program Studi Sistem Informasi

Dennis Jusuf Ziegel, Universitas Prima Indonesia

Fakultas Sains dan Teknologi, Program Studi Sistem Informasi

References

Cambria, E., & White, B. (2014). Jumping NLP curves: A review of natural language processing research. IEEE Computational Intelligence Magazine, 9(2), 48–57. https://doi.org/10.1109/MCI.2014.2307227

Chen, T., He, T., & Benesty, M. (2018). XGBoost : eXtreme Gradient Boosting. R Package Version 0.71-2, 1–4.

Eilertz, D., Mitterer, M., & Buescher, J. M. (2022). AutomRm: An R Package for Fully Automatic LC-QQQ-MS Data Preprocessing Powered by Machine Learning. Analytical Chemistry, 94(16), 6163–6171. https://doi.org/10.1021/acs.analchem. 1c05224

Farisi, A. A., Sibaroni, Y., & Faraby, S. Al. (2019). Sentiment analysis on hotel reviews using Multinomial Naïve Bayes classifier. Journal of Physics: Conference Series, 1192(1). https://doi.org/10.1088/1742-6596/1192/1/012024

Fathullah, N. S., Sari, Y. A., & Adikara, P. P. (2020). Analisis Sentimen Terhadap Rating dan Ulasan Film dengan menggunakan Metode Klasifikasi Naïve Bayes dengan Fitur Lexicon-Based. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 4(2), 590–593. http://j-ptiik.ub.ac.id

García-Pablos, A., Cuadros, M., & Linaza, M. T. (2016). Automatic analysis of textual hotel reviews. Information Technology and Tourism, 16(1), 45–69. https://doi.org/10.1007/s40558-015-0047-7

Nasution, M. R. A., & Hayaty, M. (2019). Perbandingan Akurasi dan Waktu Proses Algoritma K-NN dan SVM dalam Analisis Sentimen Twitter. Jurnal Informatika, 6(2), 226–235. https://doi.org/10.31311/ji.v6i2.5129

Peng, H. gang, Zhang, H. yu, & Wang, J. qiang. (2018). Cloud decision support model for selecting hotels on TripAdvisor.com with probabilistic linguistic information. International Journal of Hospitality Management, 68(October 2017), 124–138. https://doi.org/10.1016/j.ijhm.2017.10.001

Saleh, A., Indra, E., & Harahap, M. (2020). Kombinasi Jaringan Learning Vector Quantization Dan Normalized Cross Correlation Pada Pengenalan Wajah. Jurnal Sistem Informasi Dan Ilmu Komputer Prima (JUSIKOM PRIMA), 3(2), 13–20. https://doi.org/10.34012/jusikom.v3i2.851

Shuai, Q., Huang, Y., Jin, L., & Pang, L. (2018). Sentiment Analysis on Chinese Hotel Reviews with Doc2Vec and Classifiers. Proceedings of 2018 IEEE 3rd Advanced Information Technology, Electronic and Automation Control Conference, IAEAC 2018, Iaeac, 1171–1174. https://doi.org/10.1109/IAEAC.2018.8577581

Sitanggang, R., Ryan, D., Sitompul, H., Sinurat, S. H., Stumorang, A., Ziegel, D. J., Rahmad, J., & Indra, E. (2022). Sentiment Analysis Compare Linear Regression And Decision Tree Regression Algorithm To Determine Film Rating Accuracy. 10(2), 880–890.

Song, Y. Y., & Lu, Y. (2015). Decision tree methods: applications for classification and prediction. Shanghai Archives of Psychiatry, 27(2), 130–135. https://doi.org/10.11919/j.issn.1002-0829.215044

Taufik, A. (2018). Komparasi Algoritma Text Mining Untuk Klasifikasi Review Hotel. Jurnal Teknik Komputer, IV(2), 112–118. https://doi.org/10.31294/jtk.v4i2.3461

Tummers, J., Catal, C., Tobi, H., Tekinerdogan, B., & Leusink, G. (2020). Coronaviruses and people with intellectual disability: an exploratory data analysis. Journal of Intellectual Disability Research, 64(7), 475–481. https://doi.org/10.1111/jir.12730.

Downloads

Published

2023-03-30

Citation Check