SISTEMA PARA EL MONITOREO DE OPINIÓN CENTRADO EN ENTIDADES A PARTIR DE TWITTER
Resumen
Resumen
El análisis de la reputación en línea es una tarea que está atravesando un gran momento, debido a que actualmente existe un fuerte interés en la gran cantidad de opiniones publicadas, ya sea positivas o negativas, que se generan alrededor de un evento o entidad con el fin de conocer su prestigio en las redes sociales. La minería de opiniones se enfoca en determinar la polaridad de las publicaciones de una entidad con la finalidad de monitorear opiniones en línea. Este artículo presenta un sistema para el monitoreo de la opinión centrado en entidades utilizando textos de Twitter en español generados en línea. El proceso completo involucra, primero decidir la polaridad de un texto, determinando si el contenido tiene implicaciones positivas, negativas o neutras, después, obtener un monitoreo global (opinión colectiva) de una entidad. Se utiliza un promedio de las polaridades de cada palabra del mensaje, y luego, un promedio de las polaridades de los mensajes generados para una entidad.
Palabras Clave: Análisis de opinión centrado en entidades, análisis de textos en español, minería de opiniones, monitoreo de medios.
SYSTEM FOR THE MONITORING OF OPINION CENTERED ON ENTITIES FROM TWITTER
Abstract
Online reputation is a very important task gaining a great interest because of the huge amount of opinions published, positive or negative, about a particular event or entity with the aim of knowing the status in social networks. Opinion mining is a research area focused in analyzing texts in order to determine its polarity in order to monitor the online opinions about entities. This paper presents a system for the monitoring of entity-centered opinion using Spanish twitter texts generated on line. The process is two-fold, first to decide the polarity of a text, verifying whether or not the content has positive, negative or neutral implications, thereafter, to determine the global monitoring (collective opinion) of an entity. The process requires to calculate the average of the message word polarities, and then, to obtain the average of the polarities of messages generated by a given entity.
Keywords: Entity-centered, media monitoring, opinion analysis, opinion mining, Spanish text analysis.
Texto completo:
1331-1346 PDFReferencias
Alegria, I., Aranberri, N., Fresno, V., Gamallo, P., Padró, L., San Vicente, I., Turmo, J., & Zubiaga, A. Introducción a la tarea compartida Tweet-Norm, Normalización léxica de tuits en español. Tweet Normalization Workshop at SEPLN 2013: An overview. Proceedings of the Tweet Normalization Workshop co-located with 29th Conference of the Spanish Society for Natural Language Processing (SEPLN 2013). Vol. 1086, pp. 1-9, Septiembre 2013.
Amigó, E., Carrillo de Albornoz, J., Chugur, I., Corujo, A., Gonzalo, J., Meij, E., de Rijke, M., & Spina, D. Overview of RepLab 2013: Evaluating Online Reputation Monitoring Systems. P. Forner, H. Müller, R. Paredes, P. Rosso, B. Stein (eds.) CLEF. Lecture Notes in Computer Science. Vol. 8138, pp 333 – 352, 2013.
Brooke, J., Tofiloski, M., & Taboada, M. Cross-Linguistic Sentiment Analysis: From English to Spanish. RANLP, pp. 50-54, 2009.
Carrillo-de-Albornoz, J., Amigó, E., Plaza, L., & Gonzalo, J. Tweet Stream Summarization for Online Reputation Management. Ferro N. et al. (eds) Advances in Information Retrieval. ECIR 2016. Lecture Notes in Computer Science, vol. 9626. Springer, Cham, pp. 378-389, 2016.
Fernández, A., Nuñez, L., Morere, P., & Santos, A. Sentiment Analysis and Topic Detection of Spanish Tweets: A comparative Study of NLP Techniques. Procesamiento del Lenguaje Natural, Revista nº 50, pp. 45-52, 2013.
Fernández, J., Boldrini, Gómez, E. J. M., & Martínez-Barco, P., Análisis de sentimientos y minería de opiniones: el corpus EmotiBlog. Procesamiento del Lenguaje Natural, Revista nº 47, pp. 179-187, Septiembre de 2011.
Han, B., & Baldwin, T., Lexical Normalisation of Short Text Messages: Makn Sens a# twitter. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies-Volume 1. Association for Computational Linguistics, pp. 368-378, 2011.
Keyhole. Hashtag Tracking for Twitter, Instagram and Facebook – Keyhole, Keyhole.co, 2016: http://keyhole.co/preview.
Nielsen, F. Å., A new ANEW: Evaluation of a word list for sentiment analysis in microblogs. Proceedings of the ESWC2011 Workshop on 'Making Sense of Microposts', Heraklion, Grece, pp. 93-98, Mayo 2011.
Pang, B., Lee L., & Vaithyanathan, S., Thumbs up? Sentiment Classification using Machine Learning Techniques. Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing-Volume 10. Association for Computational Linguistics, pp. 79-86, 2002.
Pérez-Rosas, V., Banea, C., & Mihalcea, R. Learning Sentiment Lexicons in Spanish. LREC, pp. 3077-3081, 2012.
SemanticWebBuilder, 2017: http://www.semanticwebbuilder.org.mx/swb /swb/SWBSocial.
Sidorov, G., Miranda-Jiménez, S., Viveros-Jiménez, F., Gelbuck, A., Castro-Sánchez, N., Velásquez, F., Díaz-Rangel, I., Suárez-Guerra, S., Treviño, A., & Gordon, J., Empirical Study of Machine Learning Based Approach for Opinion Mining in Tweets. Lecture Notes in Artificial Intelligence LNAI, vol 7629, pp. 1-14, 2012.
Twitter Inc. Twitter Developer Documentation, 2017 Twitter Inc: https://dev.twitter.com/streaming/overview.
URL de la licencia: https://creativecommons.org/licenses/by/3.0/deed.es
Pistas Educativas está bajo la Licencia Creative Commons Atribución 3.0 No portada.
TECNOLÓGICO NACIONAL DE MÉXICO / INSTITUTO TECNOLÓGICO DE CELAYA
Antonio García Cubas Pte #600 esq. Av. Tecnológico, Celaya, Gto. México
Tel. 461 61 17575 Ext 5450 y 5146
pistaseducativas@itcelaya.edu.mx