“El periodismo de datos lo puede ejercer cualquiera, no es sólo para una élite”

Tatiana Velásquez | Madrid | 05/03/2014

Sandra Crucianelli

Sandra Crucianelli. Imagen cortesía de ICFJ

Sandra Crucianelli es una de las pioneras en la enseñanza y el ejercicio del periodismo de datos en español. Desde sololocal.info, sitio que cofundó en 2008 para investigar el gobierno de la ciudad argentina de Bahía Blanca, publica historias que han implicado búsquedas en bases de datos, conversión de archivos, análisis en hojas de cálculo y visualizaciones.

Autora del libro electrónico Herramientas digitales para periodistas, instructora del primer curso masivo online de periodismo de datos en español, organizado por el Centro Knight para el Periodismo en las Américas, y formadora en diversos talleres impartidos en Estados Unidos y América Latina, Crucianelli aboga por la precisión periodística y una mejor relación de los reporteros con los números.

Como ganadora de la fellowship del International Center for Journalists (ICFJ), durante 2012 y 2013 esta argentina lideró la integración del equipo de datos del diario bonaerense La Nación con el resto de la redacción, construyó dos aplicaciones informativas y viajó por las provincias de su país enseñando a traducir el contenido de celdas y filas en historias de interés público.

Sobre las búsquedas de información en la web y la necesidad de perderle el miedo a programas como Excel, Crucianelli conversó por Skype con MasInvestigacion

 ¿Qué es el periodismo de datos?

Es el mismo periodismo de investigación que se ha hecho siempre, pero con herramientas diferentes y un caudal de información enorme. A partir de mucha información, que a veces es tan grande que no cabe en una hoja de cálculo y de herramientas como Google Fusion Tables o Tableau Public, se inicia la búsqueda de noticias. Hay un tercer elemento que también marca una diferencia y es la incorporación del programador al equipo de noticias.

Parece que hay mayor énfasis en las publicaciones de conjuntos de datos y visualizaciones, pero no siempre acompañadas de historias periodísticas. ¿Cree que a veces se le da más importancia a las ‘DD’ y no a la ‘J’ cuando hacemos Data Driven Journalism (DDJ)?

Las visualizaciones que no están acompañadas de una historia no me resultan muy atractivas, aunque visualmente lo sean. La gente consume medios de comunicación para conocer historias. Hay que hacer una distinción entre lo que es una aplicación de noticias como ‘busque la escuela con mayor rendimiento académico para decidir dónde matricular a su hijo’ de La Nación de Costa Rica y una visualización interactiva. En las aplicaciones hay una colección grande de datos como las creadas por La Nación o ProPublica. El diseño de una news application [aplicación para presentar noticias] ha pasado por las manos de un programador. En visualizaciones, como las hechas en Mapbox o Tableau, no. El periodista aprende a usar las herramientas en línea a través de tutoriales o se descarga un programa y las realiza.

Todavía hay algunos periodistas que confunden una cosa con la otra. Una news application es una visualización interactiva, pero no necesariamente una visualización interactiva es una news application.

Hay dos quejas frecuentes sobre esta modalidad: que se le llame periodismo de datos porque los periodistas siempre han trabajado con datos y que se pueda estar promoviendo un reporterismo hecho sólo a golpe de ratón. ¿Qué opinión le merecen estas percepciones?

La definición correcta es periodismo de base de datos. Le llamamos periodismo de datos por comodidad en el manejo del lenguaje. Todos los periodistas manejamos datos, pero la diferencia es el volumen que se utiliza como punto de partida y el trabajo previo que hay que hacer para extraer esos datos, que suelen estar en formatos cerrados.

Frente al reporterismo de PC [el que se hace sin fuentes humanas] te voy a contar una historia. En Argentina, en 2008, muchos periodistas nos quedamos sin fuentes orales oficiales. El manejo de la información se había reducido a reproducir los boletines de prensa. Mi esposo [Gabriel Bermúdez, también periodista argentino] y yo fundamos el sitio sololocal.info, basado sólo en fuentes documentales, porque pensábamos que cabía un espacio para el periodismo asistido por ordenador. Conseguimos muchas primicias, sin embargo el que hayamos hecho esto no significa que debamos abandonar el llamado telefónico. No hay nada que reemplace al periodista recorriendo las calles de su ciudad o entrevistando cara a cara a una fuente.

Hay trabajos que pueden hacerse con fuentes digitales y el periodismo de base de datos se encuadra perfectamente dentro de esta categoría. Es solo una parte del periodismo y eso debe quedar claro.

¿Cuál es su metodología de investigación cuando trabaja con bases de datos?

Las investigaciones periodísticas comienzan generalmente de la misma manera, planteándonos una hipótesis que puede ser por afirmación o interrogación. A partir de esa hipótesis se hacen análisis de datos, se cruzan variables, se ponen esos datos sobre un mapa, se hacen cálculos. Luego llegan las conclusiones que pueden confirmar la hipótesis o refutarla.

Vivo en una ciudad pequeña, que está a casi 700 kilómetros al sur de Buenos Aires, donde los medios de comunicación son entre medianos y pequeños, donde no hay grandes recursos para equipos de datos. Mi esposo y yo hacemos todo en sololocal.info: la descarga de datos, la extracción, el análisis, la subida de los sets de datos. Cuando comenzamos ni siquiera sabíamos que estábamos haciendo periodismo de datos y usábamos sistemas para graficar como Manyeyes. Ese sería un periodismo de datos con recursos mínimos.

Muchos piensan que el periodismo de datos es para una élite, que sólo pueden hacerlo los que tienen un programador, un analista de sistemas, un minero de datos, un experto en seguridad informática, un experto en web scraping [extracción] de datos. Sí, se requieren habilidades específicas, pero hay distintos niveles. Todo dependerá de los recursos humanos que tenga cada medio de comunicación.

¿Cómo puede, entonces, un equipo pequeño comenzar a hacer periodismo de datos?

Hay unas condiciones que deben reunir los periodistas interesados en hacer este tipo de periodismo: una de ellas es el manejo de Excel. Es muy difícil hacer periodismo de datos sin que el reportero conozca este programa o cualquier aplicación similar. La mayor parte de los datos que trabajamos se vuelcan en una hoja de cálculo. Sabiendo funciones básicas como calcular promedios, hacer variaciones porcentuales o manejo de gráficos tendremos un buen punto de partida.

Si el periodista sabe cómo buscar información en la web, cómo extraer datos y cómo armar un dataset tendrá buenas bases para comenzar a practicar esta especialidad. Se necesita que aprenda a hacer visualizaciones. Hay muchas herramientas en línea, gratuitas y fáciles de gestionar como Datawrapper o Manyeyes. Al que pueda descargar un programa le recomiendo Tableau Public, de los más completos que he visto en materia de visualización interactiva.

También se requiere aprender a buscar datos en diferentes formatos y con restricción de dominios. Me he encontrado con periodistas que tienen una maestría en Periodismo y no saben usar la búsqueda avanzada de Google o los operadores para restringir formato.

Los periodistas deberían leer inglés. Hay mucha información de los países latinoamericanos en los sitios web del gobierno estadounidense. Si se va a acceder a esas bases de datos y no se lee inglés resulta difícil. No digo que leer inglés sea determinante, pero ayuda muchísimo.

¿El uso de tanto software, muchas veces de pago, puede convertirse en una limitación para la práctica de esta especialidad?

No siempre se requieren herramientas de pago y difíciles de usar. En el libro que acabo de publicar, Herramientas Digitales para Periodistas (segunda edición), recomiendo cuáles usar. Las he seleccionado teniendo en cuenta tres ejes: que sean gratuitas, que estén en línea porque en muchas redacciones los periodistas no pueden descargar los programas y que estén en español.

¿Se aprende mejor el periodismo de datos teniendo algunos años de experiencia laboral?

Depende. Conozco periodistas de 50 años de edad que todavía no saben cómo funcionan las instituciones de su país y conozco a jóvenes de 20 que entienden a la perfección la división de los poderes y las normas que rigen el sistema democrático. Hay que conocer muy bien el país en el que se vive, cómo funciona la administración pública, porque generalmente los datos que usamos han sido extraídos u obtenidos de bases de datos oficiales o de organizaciones no gubernamentales.

Un periodista que está investigando la evolución del endeudamiento de su país con los préstamos del Banco Mundial, por ejemplo, debe entender muy bien cuál es la operatoria de esos préstamos, las palabras que identifican cada una de las variables, saber incluso sobre presupuesto público para entender cómo se ejecutan las partidas.

Los gobiernos están produciendo a través de sus portales web un gran volumen de información y esa tendencia encuentra a muchos periodistas sin saber cómo manejar esos datos. También hay un problema en las universidades. Algunos programas de Periodismo no se han actualizado lo suficiente para ofrecer este tipo de conocimiento. No se trata de brindar un Excel teórico. Los que estudian Periodismo necesitan un Excel práctico con el que puedan contar historias.

¿Cuáles fueron las necesidades de aprendizaje que detectó durante la instrucción del MOOC (o curso online abierto y masivo por sus siglas en inglés)?

El MOOC llegó a tener casi cuatro mil inscritos y lo que más me preguntaban era sobre la búsqueda de datos. En América Latina todavía tenemos un problema gravísimo de acceso a la información y he descubierto en los talleres que dicto que en la medida en que se van haciendo búsquedas profundas se encuentra en los sitios gubernamentales más información de la que se creía publicada. Si los datos no están en las web gubernamentales de nuestros países pueden estar en los de alguna ONG o en las de los gobiernos de otros países. También encontré muchas dudas sobre cómo acceder a las bases de datos de organismos como el Banco Mundial, que tiene sus datasets en una plataforma sofisticada llamada Socrata.

En cuanto al derecho de acceso a la información, ¿qué hacer en países donde no hay leyes de transparencia o la jurisprudencia no es acatada por los funcionarios?

Esas peticiones de información que son negadas deben ser noticiables. Si le niegan información una y otra vez o pasa mucho tiempo sin obtener respuesta, el periodista tiene la herramienta a través de su voz, su imagen o su pluma para decirle a la gente que hace meses está pidiéndole una información al gobierno. En la medida en que la negativa a entregar datos sea pública llegará un punto, lo digo basada en mi experiencia, en que esos datos comenzarán a abrirse sea porque el gobierno decide hacerlos públicos o por decisiones judiciales.

Hay muchos periodistas que al recibir un ‘no’ dejan de investigar…

Eso es un error. Si tienen una plataforma pueden instalar un contador para llevar el registro de los días que suman sin la información. Cuando a un periodista le entregan un documento en papel, incluso lo hacen los que trabajan para plataformas digitales, suele transcribir parte de ese documento o a lo sumo escanear una o dos páginas, pero no lo digitaliza completo ni lo comparte con su audiencia. Una de las buenas prácticas que sugiero es compartir todos los documentos originales porque cualquiera puede dudar de la veracidad de los datos que presentamos. La mejor manera de darle más credibilidad a la historia es digitalizando los documentos y subiéndolos a una plataforma.

¿Estamos pasando por una gran moda o el periodismo de datos será una disciplina masiva a mediano plazo?

No estoy muy segura de que se masifique en Latinoamérica en el mediano plazo. No todos los medios van a hacer este tipo de práctica, pero sí creo que un creciente número de medios y de periodistas van a dedicarse a esto. Conozco un periodista argentino, Andy Tow, que produce contenidos de periodismo de datos y los publica en su blog. Es un buen ejemplo de cómo una persona sola, apartada de un medio de comunicación, puede producir contenidos basados en datos. Creo que van a surgir muchas iniciativas personales como la de él. Yo misma estoy reformando sololocal.info.

¿Qué sitios les recomienda seguir a quienes quieran saber sobre periodismo de datos?

Hay muchas iniciativas en inglés, pero hay dos que recomiendo mucho: Data Drive Journalism y Nieman Lab. También recomiendo el Medialab-Prado de España y los medios que tengo identificados por hacer proyectos de datos: ProPublica, The New York Times, Washington Post y LA Times. En Latinoamérica, La Nación de Costa Rica, La Nación de Argentina y Folha y O Estado de Brasil. Estos medios van guiando el camino hacia dónde nos dirigimos.