ANÁLISIS DE LA POLARIDAD EN COMENTARIOS DE ESTUDIANTES UNIVERSITARIOS SOBRE EL DESEMPEÑO DE SUS PROFESORES (POLARITY ANALYSIS OF UNIVERSITY STUDENT COMMENTS ABOUT THEIR PROFESSORS PROFESIONAL PERFORMANCE)
Resumen
El análisis de la polaridad, en cualquier tipo de comentario, es una tarea que está teniendo un gran auge, debido a que actualmente existe un fuerte interés en determinar automáticamente si las opiniones publicadas en medios públicos tienen un carácter positivo o negativo. La minería de opiniones se enfoca en determinar la polaridad de las publicaciones para, generalmente, dar seguimiento a la reputación de una entidad. Este artículo presenta los resultados obtenidos tras analizar la polaridad de comentarios emitidos por estudiantes universitarios en relación a su percepción sobre el desempeño de sus profesores frente a grupo. El enfoque del artículo es estudiar el rendimiento de diversos clasificadores supervisados en la tarea, anteriormente mencionada, con la finalidad de construir a mediano plazo un sistema para la clasificación automática de la polaridad de comentarios escritos por estudiantes universitarios. Los resultados obtenidos muestran que es posible crear un modelo de clasificación basado en máquinas de vectores de soporte que clasifique correctamente la polaridad de comentarios universitarios con un porcentaje de efectividad cercano al 92% usando un conjunto balanceado de 10,000 datos de entrada.
Analysis of polarity, in any type of document, is a task that is having a great boom. Nowadays, there is a high interest in the construction of automatic methods for determining whether or not opinions published in public media have a positive or negative polarity. Opinion mining focuses on determining the polarity of publications, such as reviews or text comments, in order to analyze the reputation of a given entity. This paper presents the results obtained after analyzing the polarity of university student comments. The aim of this paper is to study the performance of different supervised classifiers in the aforementioned task in order to further construct a computational system for the automatic classification of comments polarity. The results obtained up to now show that it is possible to create a classification model based on support vector machines that correctly classifies the polarity of university student comments with a percentage close to 92%, using a balanced dataset of 10,000 samples.
Texto completo:
946-961 PDFReferencias
Amigó, E., Carrillo de Albornoz, J., Chugur, I., Corujo, A., Gonzalo, J., Meij, E., de Rijke, M., & Spina, D. Overview of RepLab 2013: Evaluating Online Reputation Monitoring Systems. P. Forner, H. Müller, R. Paredes, P. Rosso, B. Stein (eds.) CLEF. Lecture Notes in Computer Science. Vol. 8138. 2013, pp 333 – 352.
Brooke, J., Tofiloski, M., & Taboada, M.: Cross-Linguistic Sentiment Analysis: From English to Spanish. RANLP. 2009, pp 50-54.
Carrillo-de-Albornoz, J., Amigó, E., Plaza, L., & Gonzalo, J.: Tweet Stream Summarization for Online Reputation Management. Ferro N. et al. (eds) Advances in Information Retrieval. ECIR 2016. Lecture Notes in Computer Science, vol. 9626. Springer, Cham. 2016, pp 378-389.
Fernández, A., Nuñez, L., Morere, P., & Santos, A.: Sentiment Analysis and Topic Detection of Spanish Tweets: A comparative Study of NLP Techniques. “Procesamiento del Lenguaje Natural, Revista nº 50”. Marzo de 2013, pp 45-52.
Fernández, J., Boldrini, Gómez, E. J. M., & Martínez-Barco, P.: Análisis de sentimientos y minería de opiniones: el corpus EmotiBlog. Procesamiento del Lenguaje Natural, Revista nº 47”. Septiembre de 2011, pp 179-187.
Hu, M., & Liu, B.: Mining and summarizing customer reviews. Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. KDD '04, ACM, New York, NY, USA, 2004, pp 168-177.
Manning, C., & Schütze, H.: Foundations of statistical natural language processing. MIT Press, Cambridge, USA, 1999.
Miller, G.A., Beckwith, R., Fellbaum, C., Gross, D., & Miller, K.: Wordnet: An on-line lexical database. “International Journal of Lexicography 3”, 1990, pp. 235- 244.
Mohammad, S.M., Bravo-Marquez, F., Salameh M., & Kiritchenko, S.: Semeval-2018 Task 1: Affect in Tweets. “Proceedings of the International Workshop on Semantic Evaluation (SemEval-2018)”, New Orleans, LA, USA, June 2018.
Nasukawa, T., & Yi, J.: Sentiment analysis: Capturing favorability using natural language processing. “Proceedings of the 2Nd International Conference on Knowledge Capture”. K-CAP '03, ACM, New York, NY, USA, 2003, pp 70-77.
Pang, B., Lee L., & Vaithyanathan, S.: Thumbs up? Sentiment Classification using Machine Learning Techniques. “Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing-Volume 10”. Association for Computational Linguistics, 2002, pp 79-86.
Pérez-Rosas, V., Banea, C., & Mihalcea, R.: Learning Sentiment Lexicons in Spanish. LREC. 2012, pp 3077-3081.
Rosenthal, S., Farra, N., Nakov P.: SemEval-2017 Task 4: Sentiment Analysis in Twitter. Proceedings of the 11th International Workshop on Semantic Evaluation. Vancouver, Canada. August 2017.
Sidorov, G., Miranda-Jiménez, S., Viveros-Jiménez, F., Gelbukh, A., Castro-Sánchez, N., Velásquez, F., Díaz-Rangel, I., Suárez-Guerra, S., Treviño, A., & Gordon, J.: Empirical Study of Machine Learning Based Approach for Opinion Mining in Tweets. “Lecture Notes in Artificial Intelligence LNAI, vol 7629”. 2012, pp 1-14.
URL de la licencia: https://creativecommons.org/licenses/by/3.0/deed.es
Pistas Educativas está bajo la Licencia Creative Commons Atribución 3.0 No portada.
TECNOLÓGICO NACIONAL DE MÉXICO / INSTITUTO TECNOLÓGICO DE CELAYA
Antonio García Cubas Pte #600 esq. Av. Tecnológico, Celaya, Gto. México
Tel. 461 61 17575 Ext 5450 y 5146
pistaseducativas@itcelaya.edu.mx