Análisis de la opinión pública en Twitter sobre el mandato del alcalde Daniel Quintero

Generalidades

En este artículo queremos consolidar y presentar el análisis de la opinión pública en Twitter sobre el mandato del alcalde Daniel Quintero. Los resultados se obtienen del análisis de los tweets dirigidos a la cuenta personal del Alcalde de Medellín en Twitter @QuinteroCalle, durante su mandato en el primer semestre del presente año.

Nuestro objetivo principal fue comprender la opinión que las personas manifestaron en la red, en dos dimensiones: el uso de las palabras y las emociones que se conducían a través de dichas palabras. Esta separación es artificial y se justifica en un aspecto metodológico de nuestro trabajo que implica el uso de herramientas para el procesamiento del lenguaje natural y el análisis de sentimientos y emociones.

Nuestras capacidades nos permitan fácilmente almacenar, disponer, procesar e interpretar un número considerable de bytes. Sin ser Big Data aún, se necesitan semanas para disponer y procesar 80.000 tweets sin auxilio de herramientas y metodologías especializadas. En el siguiente slide pueden ver un resumen de los datos generales reunidos para el trabajo

Análisis de sentimientos y emociones

En este semestre, al alcalde le han dirigido 80062 tweets en calidad de réplicas y menciones. Un volumen importante de datos con los cuales podemos tener una buena aproximación a los temas más relevantes en el pasado semestre y a las emociones y sentimientos que los acompañan.

Comenzamos por los sentimientos. El algoritmo indica que el sentimiento positivo predomina sobre el negativo como puede observarse en la gráfica. Entre febrero y marzo se emparejaron por momentos. En junio hay una caída importante en el número de tweets y por tanto en los sentimientos manifestados.

¿Qué concluimos del comportamiento de los sentimientos? Es evidente una polarización de los twitteros hacia la gestión del alcalde, en la que adquiere mayor intensidad el sentimiento positivo sobreponiéndose al negativo.

Ahora, veamos cómo se comportaron las emociones en el semestre. La confianza, según el algoritmo, fue con una amplia diferencia la emoción que más se manifestó en los trinos. Seguida del miedo y la tristeza. Más adelante, se verá mejor el papel de las emociones en su relación a los temas identificados.

Procesamiento de Lenguaje Natural

Gracias al procesamiento de lenguaje natural podemos conocer con más exactitud y libres de sesgos personales, la frecuencia y la relevancia de las palabras; con lo cual se aclaran y se definen con más exactitud los temas de conversación en los tweets y se fortalece el análisis de la opinión pública en Twitter

Cada mes, la frecuencia y la relevancia varían dando lugar a las palabras con las que se formarán nuevos temas.

En este gráfico se pueden visualizar las cien palabras más relevantes (TF-IDF) usadas por las personas. Veamos cuáles fueron

Aquí los veinte temas conformados. En el gráfico, cada palabra tiene una medida que demuestra su importancia definitoria del tema. Por ejemplo, en el tema 1 las palabras vida y salud son definitorias para entender el contexto de las demás palabras

¿De qué se habló más? Veamos cuáles fueron los temas más frecuentes: el tema 9 ocupa el primer lugar y se refiere a la familia del alcalde @DanielQuintero en un momento en el que la salud de sus integrantes estuvo delicada.

Clusterización o agrupación por temas y emociones

Los tweets obtenidos se agruparon en 20 temas. Ahora, en relación con las ocho emociones básicas, quedaron divididos en dos grupos, ambos de 10 temas:

En el cluster naranja (2) las emociones destacadas (que están por encima de la media = 0.5) son la confianza, la anticipación y la alegría. Mientras que en el cluster negro (1) están por encima de la media la confianza, el miedo y la tristeza.

Clústeres de tópicos por emociones: permite ver la conformación de cada tópico

Sin embargo, al comparar los clusters entre sí, se confirma lo anterior, pero además se destaca la rabia y el disgusto como sobresalientes en el clúster 1.

Compara emociones por cada tópico según intensidad

Acá visualizamos cómo los temas se distribuyen en el cluster 2 (derecha) y en el cluster 1 (izquierda). Los temas 16, 13 y 6 son los más comentados en el cluster 1. En el otro grupo lo son los temas 9 y 2.

Volumen de los temas: permite ver cómo se distribuyen y conforman temas

Recordemos los temas del cluster 1: trataron sobre las protestas por parte de estudiantes (tema 16); el pico y placa, medidas y soluciones relacionadas (tema 13) y una crítica con palabras fuertes dirigida al alcalde (tema 6).

El cluster 2 contiene dos temas relevantes: uno referente a la salud de la familia del alcalde (tema 9) y otro que resalta positivamente su gestión (tema 2). Resalta la variedad de temas tratados durante el primer semestre por la ciudadanía.

Comportamiento de los temas y las emociones

Ahora veamos en qué meses fueron relevantes los temas analizados. Los dos temas del cluster 2 tuvieron importancia en los meses de mayo (tema 9) y en el primer mes de gestión del alcalde @QuinteroCalle (tema 2).

Tópicos por mes: permite ver el momento en que fue más importante el tema

El tema de las protestas estudiantiles tuvo lugar en el mes de febrero. Las medidas de pico y cédula fueron el tema (13) relevante en el mes de marzo y las críticas dirigidas al alcalde ocurrieron en febrero durante las protestas estudiantiles.

Por último, las emociones por tópico. Alrededor del tema 9 se manifestaron emociones de alegría y confianza, con algo de anticipación, miedo y sorpresa. En el tema 2 predominaron la confianza, alegría y anticipación. En este cluster prevalecieron emociones positivas.

Emociones por tópico: permite comparar tópicos con base en las emociones.

Conclusión

Del análisis de la opinión pública en Twitter de la cuenta del alcalde de Medellín podemos concluir que según se infiere de la teoría de las emociones de Plutchik como resultado de la díada alegría y la confianza se obtiene amor. Esta es la emoción que mejor describe los temas del cluster 2. Por el contrario, el balance del cluster 1 es negativo. En el tema de las protestas y el pico y placa se manifestaron miedo, rabia y tristeza. Y la crítica al alcalde a causa de las protestas se acompañó de disgusto, miedo, rabia y tristeza. La emoción que mejor describe el cluster 2 es el desprecio; resultado de la díada rabia y disgusto.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *