Ante una base de datos los periodistas solemos sentirnos intimidados. Y cómo no si las filas de cifras y de textos pueden terminar confundiéndonos a primera vista. Evitar que salgamos corriendo ante un archivo .csv, por ejemplo, es uno de los objetivos del periodismo de datos, especialidad que ha ganado popularidad en los últimos meses en Iberoamérica, pero que cuenta con un poco más de trayectoria en Estados Unidos y Reino Unido.

Tatiana Velásquez | Madrid | 06/02/2014

DDJ_Post_PeriodismoDatos790

Cuestiones clave en el periodismo de datos

 

El tratamiento y análisis de datos abundantes se están aplicando al periodismo mucho tiempo después que en otras disciplinas y ciencias. Así lo recordó Giannina Segnini en noviembre pasado en Medellín (Colombia) cuando recibió el reconocimiento a la Excelencia del Premio Gabriel García Márquez . Lo  que hoy denominamos “periodismo de datos”  ya tiene 40 años de historia en otras áreas, dijo la exjefa de la unidad de investigación del diario costarricense La Nación.

“Los científicos y las comunidades de inteligencia y de negocios procesan y analizan grandes volúmenes de datos para detectar patrones, tendencias y situaciones atípicas, o para explicar fenómenos y enfermedades, e incluso para anticipar comportamientos”, añadió Segnini.

Para lograr una exitosa lectura de un conjunto de datos, la reportera Mar Cabra , miembro del Consorcio Internacional de Periodistas de Investigación  y una de las periodistas más conocidas en España por el manejo de bases de datos, les recomienda a los reporteros, antes de iniciar cualquier operación, estar seguros de entender cada una de las cifras y códigos con los que están trabajando.  Los siguientes consejos son una compilación de algunas de las clases que ha dictado en el Máster en Periodismo de Investigación, Datos y Visualización que se imparte en Madrid:

1. Leer detenidamente los datos para entender su organización y evitar caer en errores por malas interpretaciones. Buscar en sitios que publican archivos similares a los que estamos trabajando facilitará ese proceso inicial de familiarización.

2. Entender cómo ha sido la recolección de los datos también es vital para una correcta interpretación del listado que tenemos en nuestra pantalla. Es necesario indagar sobre la recolección de los datos y  la estructura del formulario de recolección para saber cuán fiables o no son esos indicadores.

3. Nunca debe darse por sentado que los datos los recibiremos en formatos que nos permitirán trabajarlos de inmediato, como lo son los .csv o .xls. La mayoría de las veces habrá que hacer valer las leyes de acceso a la información del país o los países en los que estemos trabajando. Así, habrá que enviar solicitudes de información que nos conduzcan a datos en formatos abiertos y no cerrados como los que aparecen en documentos PDF no tratables.

4. Cabra recuerda que tampoco debe creerse que los datos aún cuando nos los entreguen en formato reutilizable estarán limpios, es decir, bien organizados y sin erratas. Por ello, antes de empezar a hacer tablas dinámicas en programas como Excel, por ejemplo, será necesario asegurarnos del estado de esos datos pasándolos por un software de limpieza como Open Refine.

5. Entender el contexto de los datos es otra de las claves. Debemos saber si los valores de dinero están en pesos, euros o dólares o si son bases de datos construidas con los estándares estadounidenses (comas separarán millares y los puntos harán lo propio con los decimales) o con estándares españoles (puntos separarán millares y  las comas los decimales).

 

6. Trabajar siempre sobre una copia de los datos entregados para poder volver a ellos cada vez que así se requiera es una recomendación en la que Cabra suele insistir. De llegar a borrarse información de manera accidental durante el análisis no será un gran problema si tenemos acceso al archivo original. De esta manera no correremos el riesgo de obtener resultados incompletos o errados por apelar a la memoria en aras de hacer las correcciones necesarias.

Una vez hemos hecho los cruces y obtenido las cifras que nos permitirán armar una historia, Marcos García Rey , también miembro del Consorcio Internacional de Periodistas de Investigación y coordinador del Máster en Periodismo de Investigación, Datos y Visualización, recomienda tener en cuenta las siguientes recomendaciones para no escribir una noticia o reportaje atiborrado de cifras e ilegible para el lector, oyente o espectador:

1. No debemos quedarnos sólo con los datos para iniciar la redacción de nuestra historia. Es necesario buscar fuentes humanas y elementos narrativos que logren darle matices a la pieza en construcción y poner nervios y músculos a la frialdad de los números.

2. Encontrar una historia concreta en medio de ese mar de datos es vital: es aconsejable tomar uno o dos aspectos medulares para redactar a partir de ellos la noticia y no terminar así mareando o abrumando al lector con todos los datos del archivo que hemos analizado. No pecar por exceso de datos debe ser siempre la premisa.

3. Como en todas las historias, no debemos olvidar un buen arranque especialmente en estas piezas que se construyen a partir de datos numéricos. Nuestra meta siempre será enganchar a nuestra audiencia y evitar que abandone el texto en las primeras líneas.

4. No olvidarse del contexto. Si bien nos enfocaremos en algunos de los datos del gran océano analizado, el público necesitará saber esas cifras de dónde provienen, cuál es la situación general que retratan. Por ejemplo, en el caso de una base de datos sobre los incendios de España durante la última década se hará necesario explicar cuántos incendios ha tenido España, cuántas hectáreas se han quemado, cuáles han sido las regiones más afectadas y las causas más comunes de esos incendios, pese a que la historia en la que quizá se centrará el reportero al analizar esa base de datos buscará entender las causas más comunes o las pérdidas que suelen dejar  las conflagraciones.

5. Y un consejo en el que García Rey suele insistir continuamente: “Es necesario hacer periodismo cuando tratamos de trabajar con datos, y, por ende, no olvidar la ‘J’ (Journalism) cuando queremos ejercer el ‘DDJ’ (Data Driven Journalism)”. En otras palabras, no podemos quedarnos sólo en el análisis de datos y en las visualizaciones porque la tarea estaría incompleta si no le contamos a la audiencia las noticias que se esconden detrás de esos datos.

Más recursos para escribir sobre datos numéricos: