6. Tres exercicis de periodisme de dades

6.1. Twitter: captura de dades i anàlisi de xarxes

6.1.2. Context

Les xarxes socials són un lloc important dins l’ecosistema de mitjans, on es distribueixen (i de vegades es creen) les notícies. D’entre elles, Twitter s’ha configurat com la plataforma de microblogging més popular. S’ha convertit en un lloc on informar-se (i de vegades desinformar-se). L’obertura de l’API de Twitter ha permès un accés directe a les fonts d’informació que aquest tipus de plataformes acumula (l’altre cas és Facebook, que és molt més tancada a l’hora de permetre l’accés a la seva informació). Una API és una forma estructurada d’accedir a la informació que conté una biblioteca. Analistes, acadèmics, activistes i periodistes la usen per accedir a les dades que, si no fos per l’API, haurien de comprar o raspar (en anglès, scrap). Hi ha moltíssima literatura sobre aquest tema i multitud d’articles acadèmics des de la sociologia, la politologia, les ciències de la comunicació i moltes altres disciplines que utilitzen Twitter com a cas d’estudi per la seva facilitat a l’hora d’obtenir les dades. Però deixem aquestes discussions acadèmiques de banda:

La teva cap t’ha encarregat una peça curta sobre un dels temes del moment del dia a Twitter. Qui està publicant piulades sobre el tema? Pots fer una història amb això més enllà de seleccionar les piulades més repiulades? Multitud de notícies parlen de les ingerències a Twitter per part de Rússia o Veneçuela. Com fan les anàlisis? Com capturen les dades?

D’acord, hem dit que ara Twitter ha facilitat la descàrrega de piulades, però per on hem de començar? Per a aquest exercici, hem pensat a utilitzar T-hoarder, un programari lliure que funciona en Python i que està pensat per ajudar-te a interactuar amb l’API d’una manera senzilla, sense necessitat de tenir coneixements de programació. Amb T-hoarder podràs obtenir informació de Twitter a través de la seva API (que en realitat conté tres API: REST, search i streaming) i processar la informació obtinguda per fer visualitzacions. Segons el tipus de dades que obtinguem, podrem generar un tipus de visualitzacions o d’altres. Amb els usuaris, amb els seus seguidors i amb les seves repiulades (RT) i esments, podem obtenir relacions entre usuaris per fer gràfics de xarxes (grafs). D’altra banda, si analitzem la localització de les piulades podem fer mapes.