6.1. Twitter: captura de datos y análisis de redes
6.1.2. Contexto
Las redes sociales en internet son un lugar importante dentro del ecosistema de medios, donde se distribuyen, y a veces se crean, las noticias. De entre ellas, Twitter se ha configurado como la plataforma de microblogging más popular. Se ha convertido en lugar donde informarse (y a veces desinformarse). La apertura de la API de Twitter ha permitido un acceso directo a las fuentes de información que este tipo de plataformas acumula (el otro caso es Facebook, que es mucho más cerrada a la hora de acceder a su información). Una API es una forma estructurada de acceder a la información que contiene una biblioteca. Analistas, académicos, activistas y periodistas la usan para acceder a los datos que de otra forma tendrían que comprar o «scrapear». Hay muchísima literatura al respecto y multitud de artículos académicos desde la sociología, la politología, las ciencias de la comunicación y muchas otras disciplinas que utilizan Twitter como caso de estudio por su facilidad a la hora de obtener los datos. Pero dejemos estas discusiones académicas de lado:
Tu jefa te ha encargado preparar una pequeña pieza sobre uno de los trending topics de Twitter del día. ¿Quién está publicando sobre el tema?; ¿puedes hacer una historia con ello más allá de seleccionar los tuits más retuiteados? Multitud de noticias hablan de las injerencias en Twitter de Rusia o Venezuela. ¿Cómo hacen los análisis?; ¿cómo capturan los datos?
Vale, hemos dicho que ahora Twitter lo ha puesto fácil para descargarse sus tuits, pero ¿por dónde empezar? Para este ejercicio, hemos pensado usar T-hoarder, un software libre que funciona en Python, pensado para ayudarte a interactuar con la API de una manera sencilla, sin necesidad de conocimientos de programación. Con ella podrás obtener información de Twitter a través de su API, que en realidad son tres REST, search y streaming, y procesar la información obtenida para hacer visualizaciones. Dependiendo del tipo de datos que obtengamos, podremos generar un tipo de visualizaciones u otras. Con los usuarios, con sus followers y sus retuits (RT) y menciones, podemos obtener relaciones entre usuarios para hacer gráficos de redes (grafos) o, si analizamos la localización de los tuits, podemos hacer mapas.