Analisis Perbandingan Decision Tree, Support Vector Machine, dan Xgboost dalam Mengklasifikasi Review Hotel Trip Advisor

Hansen Christanto, Julfikar Rahmad, Stiven Hamonangan Sinurat, Daniel Ryan Hamonangan Sitompul, Andreas Sitomorang, Dennis Jusuf Ziegel, Evta Indra

Abstract


Jaringan media sosial pada saat ini terus berkembang dan berdampak pada industri perhotelan. Pelanggan dan traveler telah memposting hasil review secara online untuk menunjukkan tingkat kepuasan mereka terhadap hotel dan berbagi pengalaman terkait hotel yang dikunjungi dengan pelanggan lain yang ada di seluruh belahan dunia. Situs web yang bergerak dalam pariwisata dan perhotelan berkembang pesat secara online seperti Trip advisor. Trip advisor merupakan platform penyedia layanan perjalanan dan pemesanan hotel. Penelitian menggunakan teknik analisis sentimen untuk mengkategorikan opini pengguna yang bernilai negatif maupun positif dengan bantuan kecerdasan buatan yaitu Machine Learning. Penelitian ini menguji tiga algoritma Machine Learning, yaitu Decision Tree Classifier, Support Vector Machine (SVM) dan Xgboost Classifier, dalam melakukan analisis sentimen terhadap review hotel di platform Trip advisor. Hasilnya menunjukkan bahwa Xgboost memiliki tingkat keakuratan (accuracy) yang paling tinggi, mencapai 99%, dibandingkan dengan Decision Tree (97%) dan Support Vector Machine (98%). Dengan demikian, Xgboost dianggap sebagai algoritma terbaik untuk melakukan analisis sentimen pada review hotel di Trip advisor.

 


Full Text:

PDF

References


Cambria, E., & White, B. (2014). Jumping NLP curves: A review of natural language processing research. IEEE Computational Intelligence Magazine, 9(2), 48–57. https://doi.org/10.1109/MCI.2014.2307227

Chen, T., He, T., & Benesty, M. (2018). XGBoost : eXtreme Gradient Boosting. R Package Version 0.71-2, 1–4.

Eilertz, D., Mitterer, M., & Buescher, J. M. (2022). AutomRm: An R Package for Fully Automatic LC-QQQ-MS Data Preprocessing Powered by Machine Learning. Analytical Chemistry, 94(16), 6163–6171. https://doi.org/10.1021/acs.analchem. 1c05224

Farisi, A. A., Sibaroni, Y., & Faraby, S. Al. (2019). Sentiment analysis on hotel reviews using Multinomial Naïve Bayes classifier. Journal of Physics: Conference Series, 1192(1). https://doi.org/10.1088/1742-6596/1192/1/012024

Fathullah, N. S., Sari, Y. A., & Adikara, P. P. (2020). Analisis Sentimen Terhadap Rating dan Ulasan Film dengan menggunakan Metode Klasifikasi Naïve Bayes dengan Fitur Lexicon-Based. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 4(2), 590–593. http://j-ptiik.ub.ac.id

García-Pablos, A., Cuadros, M., & Linaza, M. T. (2016). Automatic analysis of textual hotel reviews. Information Technology and Tourism, 16(1), 45–69. https://doi.org/10.1007/s40558-015-0047-7

Nasution, M. R. A., & Hayaty, M. (2019). Perbandingan Akurasi dan Waktu Proses Algoritma K-NN dan SVM dalam Analisis Sentimen Twitter. Jurnal Informatika, 6(2), 226–235. https://doi.org/10.31311/ji.v6i2.5129

Peng, H. gang, Zhang, H. yu, & Wang, J. qiang. (2018). Cloud decision support model for selecting hotels on TripAdvisor.com with probabilistic linguistic information. International Journal of Hospitality Management, 68(October 2017), 124–138. https://doi.org/10.1016/j.ijhm.2017.10.001

Saleh, A., Indra, E., & Harahap, M. (2020). Kombinasi Jaringan Learning Vector Quantization Dan Normalized Cross Correlation Pada Pengenalan Wajah. Jurnal Sistem Informasi Dan Ilmu Komputer Prima (JUSIKOM PRIMA), 3(2), 13–20. https://doi.org/10.34012/jusikom.v3i2.851

Shuai, Q., Huang, Y., Jin, L., & Pang, L. (2018). Sentiment Analysis on Chinese Hotel Reviews with Doc2Vec and Classifiers. Proceedings of 2018 IEEE 3rd Advanced Information Technology, Electronic and Automation Control Conference, IAEAC 2018, Iaeac, 1171–1174. https://doi.org/10.1109/IAEAC.2018.8577581

Sitanggang, R., Ryan, D., Sitompul, H., Sinurat, S. H., Stumorang, A., Ziegel, D. J., Rahmad, J., & Indra, E. (2022). Sentiment Analysis Compare Linear Regression And Decision Tree Regression Algorithm To Determine Film Rating Accuracy. 10(2), 880–890.

Song, Y. Y., & Lu, Y. (2015). Decision tree methods: applications for classification and prediction. Shanghai Archives of Psychiatry, 27(2), 130–135. https://doi.org/10.11919/j.issn.1002-0829.215044

Taufik, A. (2018). Komparasi Algoritma Text Mining Untuk Klasifikasi Review Hotel. Jurnal Teknik Komputer, IV(2), 112–118. https://doi.org/10.31294/jtk.v4i2.3461

Tummers, J., Catal, C., Tobi, H., Tekinerdogan, B., & Leusink, G. (2020). Coronaviruses and people with intellectual disability: an exploratory data analysis. Journal of Intellectual Disability Research, 64(7), 475–481. https://doi.org/10.1111/jir.12730.




DOI: https://doi.org/10.37012/jtik.v9i1.1429

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 julfikar rahmad, Hansen Christanto, Stiven Hamonangan Sinurat, Dennis Jusuf Ziegel, Evta Indra, Daniel Ryan Hamonangan Sitompul

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Address:
Universitas Mohammad Husni Thamrin
Jl. Raya Pd. Gede No.23-25, RT.2/RW.1, Dukuh, Kec. Kramat jati, Kota Jakarta Timur, Daerah Khusus Ibukota Jakarta 13550

Creative Commons License
Jurnal Teknologi Informatika & Komputer Mohammad Husni Thamrin is licensed under a Creative Commons Attribution 4.0 International License.

View My Stats