Ya hace un tiempo traduje todo el Modelo para la redacción del siglo XXI cuya parte principal es el Diamante de noticias en contraposición a la clásica pirámide invertida que enseñan en cualquier facultad de periodismo (luego vimos el ciclo de vida de las noticias digitales: el diamante de noticias reimaginado y otra vez el diamante de noticias reinterpretado).

Pero ahora una vez más Paul Bradshaw nos trae un diagrama interesante para, en este caso, explicar el proceso de creación del periodismo de datos. Esta pirámide invertida del periodismo de datos muestra de forma simple como se avanza desde una gran cantidad de información que incrementalmente se va enfocando hasta llegar al punto de comunicar los resultados a la audiencia de la forma más clara posible. A continuación, la traducción del artículo donde podemos ver las diferentes etapas del proceso de data journalism:

Compilar

“El periodismo de datos empieza en una de dos formas: o tienes una pregunta que necesita data o tienes un dataset que necesita ser interrogado. De cualquier forma, la compilación de información es lo que lo define como un acto de periodismo de datos y puede tener varias formas:

  1. Provista directamente por una organización
  2. Encontrada usando técnicas de búsqueda avanzada para surcar en las profundidades de sitios web de gobiernos
  3. Al hacer scraping de bases de datos escondidas online usando herramientas como OutWit Hub y Scraperwiki
  4. Convertir documentos en algo que pueda ser analizado usando herramientas como DocumentCloud
  5. Tomando información de APIs
  6. Recolectando data vos mismo a través de observación, encuestas, formularios online o crowdsourcing

Limpiar

Tener información es sólo el comienzo. Estar confiado en las historias escondidas adentro significa poder confiar en la calidad de la data, y eso significa limpiarla. Limpiar en general tiene 2 formas: remover el error humano y convertir la data en un formato que es consistente con otra data que estes usando.

Hay formas simples de limpar la data en Excel o Google Docs como buscar y reemplazar, clasificando para encontrar entradas inusualmente altas o bajas o vacías, y usando filtros para que sólo se muestren entradas duplicadas.

Contexto

Como cualquier fuente, la información no puede siempre ser confiable. Viene con sus propias historias, prejuicios y objetivos. Así como con cualquier fuente, necesitas hacerle preguntas: quien la recolectó, cuando, y por qué motivos. ¿Cómo fue recolectada? (la metodología). También necesitarás entender la jerga como códigos que representan categorías, clasificaciones o ubicaciones y terminología de especialistas.

Todo lo anterior probablemente te lleve a compilar más información. Por ejemplo, conocer el número de crímenes en una ciudad es interesante, pero sólo se vuelve relevante cuando lo contextualizas junto con la población, número de policías, niveles de los crímenes haces 5 años, percepción del crimen, niveles de desempleo y demás. El alfabetismo estadístico es una obligación acá. Tener una pregunta clara en el comienzo de todo el proceso, por cierto, ayuda a asegurar que no pierdas el foco en este punto, o pierdas un ángulo interesante.

Combinar

Las buenas historias se pueden encontrar en un sólo dataset, pero a menudo necesitarás combinar dos juntos. Después de todo, si te dan a elegir entre una noticia con una sola fuente y una noticia con múltiples fuentes, cuál preferirías?

La combinación clásica es el mashup de mapas: tomar un dataset y combinarlo con data de mapas para proveer una visualización instantánea de cómo algo está distribuido en el espacio. Esto es tan común (más que nada gracias a que la Google Maps API fue una de las primeras APIs útiles para periodismo) casi se ha convertido en un cliché. Pero igual, los clichés son muchas veces (sino siempre) efectivos.

Una combinación más trivial es fusionar 2 o más datasets con un punto de información común. Eso puede ser, por ejemplo, el nombre de un político, una escuela o una ubicación. Eso usualmente significa asegurarse que el punto particular de data está formateado con el mismo nombre a través de cada uno de los sets de datos.

Comunicar

En periodismo de datos, lo obvio para hacer en este punto es visualizar los resultados: en un mapa, cuadro, infografía o animación. Pero acá hay mucho más a considerar: desde la clásica narrativa, las aplicaciones de noticias, casos de estudio y personalización”. [...]Hay tanto que decir en esta etapa que Paul prometió escribir otro post al respecto próximamente (cuando esté listo pongo link acá)

About these ads

Comentarios en: "La pirámide invertida del Periodismo de Datos" (1)

  1. [...] after I published yesterday’s ‘Inverted pyramid of data journalism‘, it had been translated into Spanish – by the wonderful Mauro Accurso. The post is copied in full [...]

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

%d personas les gusta esto: