Este documento presenta TCAT, una herramienta abierta para capturar y analizar tweets y datos de Twitter desarrollada por la Iniciativa de Métodos Digitales de la Universidad de Ámsterdam. TCAT permite realizar estadísticas de tweets, exportar tweets, analizar redes y funciones experimentales. El documento describe cómo instalar TCAT y realizar consultas, así como sus ventajas como su gran capacidad de almacenamiento y manipulación de datos, y sus desventajas como problemas de instalación y lentitud.
2. ¿Qué es y de dónde viene ?
TCAT es una
herramienta abierta para
capturar y analizar
tuits y Twitter data
desarrollada por
Digital Methods Initiative
(Universidad de Amsterdam).
4. Objetivos
Agenda
+ 18h40–19h: intro - - objetivos - herramienta - instalación
+ 19h–20h15: trabajo en equipo con TCAT y datasets
+ 20h15–20h30: preguntas - seguimiento - conclusión
>> Conocer las funcionalidades y entender la potencialidad de TCAT
>> Saber cómo hacer queries y bucear/hacer hablar a los datos sobre
Madrid
5. Bloques de análisis de TCAT
1 - Tweet statistics and activity metrics
2 - Tweet exports
3 - Networks
4 - Experimental
6. Bloques de análisis de TCAT
1 Tweet statistics and activity metrics
2 Tweet exports
3 Networks
4 Experimental
7. > Detecting the socials:
How to empirically
detect and describe the
social in social media
(twitter) data? - DMI
Summer School Project
8. > Detecting the socials:
How to empirically
detect and describe the
social in social media
(twitter) data? - DMI
Summer School Project
9. > Climate Change on Twitter: Hashtag Lifelines and Actor Profiles - DMI Summer School
10. Bloques de análisis de TCAT
1 Tweet statistics and activity metrics
2 Tweet exports
3 Networks
4 Experimental
11. Geoloc
>_ mapa
*Tweet exports >
> Only tweets with lat/lon
1% tuits tiene geo-metadata
Visión sobre el territorio
Ejemplo debate TTIP:
* Elevado debate en UK por
el referéndum escocés y el
sistema de salud pública
asociado al TTIP
12. Bloques de análisis de TCAT
1 Tweet statistics and activity metrics
2 Tweet exports
3 Networks
4 Experimental
13. Fechas: 21 Septiembre --> 12 Noviembre
Criterios de captura: "@Madrid" OR "Ayuntamiento de Madrid"
Nº Tuits: 170.000
Usuarios: 50.644
14. RED CO-HASHTAG
geoMadrid
Nodos Hashtags (HT)
Links Relación entre HT que aparecen en el mismo tweet
Tamaño nodos Usuarios únicos compartiendo el HT
Grosor de links Co-ocurrencia de hashtags
Colores Clusters semánticos
TOP CLUSTERS
Instagram [47.1%]
Activistas y actualidad [17.7%]
Eventos, TV en directo [15.7%]
Día del Trabajador[11.8%]
Ofertas de Trabajo [3.8%]
Celebración de concierto [3.7%]
17. 1. Inserta tus datos en RAW
http://rawgraphs.io
Visualizar con RAWGraphs (I)
2. Elige la visualización que mejor los
representa (¡haz pruebas!)
18. 3. Selecciona los parámetros que quieres
visualizar
4. Exporta la imagen en el formato que
prefieras
http://rawgraphs.io
Visualizar con RAWGraphs (II)
19. Queries
party AND friends
party OR friends
[día del trabajo] AND [1 de mayo]
[real madrid] AND atleti AND football
[real madrid] OR atleti OR football
* Ojo! Se pueden hacer queries con AND y OR, pero no se pueden combinar
ambas.
Query: términos que queremos incluir en nuestros datos.
Exclude: términos que queremos excluir de nuestros datos.
20. PROS vs CONS
PROS
* Gran capacidad de almacenaje
* Facilidad de captura
* Permite manipular los datos
para investigación
* Grafos e información
estructurada
* Open / abierta
CONS
* Problemas de instalación
* Dashboard poco amigable
* Trabajar los datos con
otra herramienta
* Errores!
* Lento
21. Links
Github TCAT
PPT sobre TCAT
Lista Youtube DMI
Artículo TCAT: Programmed Method. Developing a Toolset for
Capturing and Analyzing Tweets
Artículo 1%: Mining One Percent of Twitter: Collections,
Baselines, Sampling