TweetExtract

Con motivo del estudio de las diferentes redes sociales, y ante la escasez de herramientas para proporcionar la información necesaria para la realización del estudio, se ha creado una aplicación (TweetExtract) en el lenguaje de programación R que permite la extracción de datos de la red social Twitter para su posterior análisis.

Aparte de extraer los datos, TweetExtract los recopila y ordena en un conjunto de datos (dataset) para su posterior descarga.

TweetExtract utiliza dos componentes principales: el entorno de desarrollo integrado (IDE) RStudio y el entorno y lenguaje de programación R.

La principal funcionalidad de TweetExtract reside en la posibilidad de extraer u analizar las publicaciones en Twitter de las cuentas públicas que el usuario seleccione. La información que proporciona esta herramienta es el listado y contenido de los tuits publicados por las cuentas que se desee analizar (independientemente del tipo de cuenta, siempre y cuando se use el nombre de dicha cuenta en su perfil de Twitter, y que su información se encuentre pública para todo el mundo). Más específicamente, TweetExtract devuelve la siguiente información:

  • Número de seguidores (followers)
  • Número de cuentas a las que se siguen (following)
  • Fecha de creación de las publicaciones
  • Número de retuits
  • Número de favoritos
  • Contenido del tweet (texto y enlace de vídeo o imagen)

TweetExtract es extensible, y permite la ampliación a través del uso de funcionalidades de otros paquetes (por ejemplo, twitteR).

Las funciones principales de TweetExtract son las siguientes:

  • Captura de datos de la red social Twitter
  • Obtención de la línea temporal (timeline) de múltiples cuentas de Twitter
  • Análisis de las cuentas de Twitter y las publicaciones que realizan, así como de las cuentas seguidas o seguidoras, de los retuits, de los favoritos, etc.
  • Visualización de las tablas en RStudio, y descarga de los datos obtenidos de Twitter en formato .csv

Los siguientes enlaces permiten la descarga de la aplicación (código fuente en R) y la guía de instalación y uso TweetExtract:

 

Presentación del proyecto

Los Organismos Públicos de Investigación (OPI) son instituciones de investigación de carácter público y de ámbito nacional que, junto con las universidades, forman el núcleo básico del sistema público de investigación científica y desarrollo tecnológico español. Una de las funciones esenciales de los OPIs es la difusión del conocimiento científico-tecnológico derivado de su actividad, principalmente a través de publicaciones y las respectivas páginas web oficiales. El uso de estos dos canales en general queda limitado a la difusión del conocimiento a profesionales del sector e investigadores dentro de los campos de actuación de cada OPI. La Web 2.0 y las redes sociales permiten ampliar el alcance e impacto, a través de redes interpersonales, de la información difundida a través de las diferentes plataformas tecnológicas que dan soporte a estas redes. Además, posibilitan llegar a sectores de la población que generalmente no se encuentran al alcance de los OPIs, como la generación de millenials, cuyo consumo de información se concentra en este tipo de redes.

El objetivo del proyecto Estudio del alcance e impacto de la difusión científico-tecnológica de los Organismos Públicos de Investigación en redes sociales, realizado por el Grupo de Investigación INNOPRO de la Universidad Politécnica de Madrid con la colaboración de la Fundación Española para la Ciencia y la Tecnología – Ministerio de Economía, Industria y Competitividad, es la elaboración de un estudio y análisis de datos de la actividad de los diferentes OPIs en las principales redes sociales (Facebook, Twitter, YouTube), así como establecer mecanismos de valoración del alcance e impacto del conocimiento difundido. Para ello, se procederá a la recopilación y análisis de datos de los contenidos publicados por los OPIs en redes sociales, definiendo métricas para identificar alcance y contenido. Una vez analizados los datos, el estudio plantea una identificación de las mejores prácticas observadas, incluyendo un caso de estudio y recomendaciones que contribuyan a la mejora de la difusión del conocimiento científico tecnológico por parte de los OPIs. Un resultado secundario del estudio será el planteamiento de una metodología y herramientas que permitan extender este estudio a otras instituciones de investigación nacionales e internacionales.

Toda la información relativa al proyecto irá siendo publicada a través de este blog y en las diferentes páginas de la web, así como en las redes sociales Facebook, Twitter y Youtube.