¿Cómo convertir los datos en visualizaciones de impacto? Mejores prácticas para la visualización de datos
septiembre, 2021

En cualquier proceso de toma de decisiones, la información es el insumo principal para identificar las situaciones a resolver y las mejores estrategias a implementar, independientemente de si se trata de una empresa o una institución de gobierno encargada del desarrollo de políticas públicas.
La visualización de datos es una herramienta valiosa para presentar información a través de formatos gráficos y contenidos visuales para facilitar su comprensión. Asimismo, facilita la interpretación de los datos y la transmisión de ideas o conceptos complejos, dado que es común que los patrones, tendencias y correlaciones pasen desapercibidas en las salidas numéricas y esto conlleva a un desaprovechamiento de los datos.
Si bien las visualizaciones brindan grandes beneficios, su realización puede ser retadora, y requiere tener presente cinco elementos:
1. Definir qué se quiere visualizar
Entender el tipo de datos ayudará a definir una meta de visualización clara, donde se identifique qué se quiere visualizar, qué se puede o no visualizar con la información disponible, y cuál es el público objetivo o los usuarios principales de las visualizaciones. Esto también permitirá definir el nivel de complejidad de las gráficas y el lenguaje con el que se abordan las temáticas. Por ejemplo, un público conformado por expertos en datos y estadística no requiere detalle en la explicación sobre los resultados arrojados por el uso de gráficas como Box Plots, a diferencia de usuarios menos conocedores del tema que pueden necesitar un contexto más amplio sobre el funcionamiento de la gráfica y la utilidad de visibilizar valores atípicos.
2. Asegurar la calidad de los datos
Para crear una buena visualización de datos es fundamental comenzar con información limpia, es decir, datos que previamente fueron sometidos a un proceso de validación y depuración en los cuales se corrigen posibles errores asociados principalmente a valores inconsistentes.
En la depuración, se revisan aspectos relevantes para el aseguramiento de la calidad, tales como el origen de los datos, en especial si se trata de datos provenientes de fuentes no oficiales; la actualización de los mismos; la identificación de valores inexactos, duplicados o incompletos; la correspondencia de los valores (es decir si los valores o las unidades de medición son coherentes con las variables definidas para el conjunto de datos); y la consistencia del formato que garantice uniformidad en la estructura de los datos.
Se recomienda usar programas especializados (tales como R o Python) que faciliten el trabajo de depuración y permitan optimizar el tiempo, en particular si se trabaja con grandes volúmenes de datos o se usan conexiones entre diferentes fuentes de datos.
La importancia de la calidad de los datos para los Objetivos de Desarrollo Sostenible (ODS)
El documento Contexto de la calidad de los datos en la medición de los ODS, elaborado por Cepei (2019), incorpora recomendaciones orientadas a garantizar estándares mínimos de calidad en la producción, análisis y comunicación de los datos para la medición de los ODS. Uno de los principales retos que aborda la investigación es el desarrollo de esquemas de interoperabilidad en las instituciones generadoras de datos tanto oficiales como no oficiales, para facilitar la búsqueda de sinergias en los procesos de transferencia e intercambio de información.
3. Analizar los diferentes tipos de gráficos
No todos los gráficos se ajustan a los datos que se quiere visualizar, por lo tanto, es necesario explorar entre la diversidad de visualizaciones que existen y escoger el formato de gráficos que mejor se adapte a las necesidades de visualización.

Por ejemplo, para graficar datos de series de tiempo, las gráficas de barras o líneas son una gran alternativa; si se busca establecer comparaciones entre magnitudes, las gráficas circulares o tortas son la mejor opción; si lo que se desea es analizar la relación entre dos variables, las gráficas de dispersión o burbujas funcionan muy bien; si por el contrario se desea analizar datos en un contexto geográfico, los mapas son ideales.
4. La interactividad como un elemento diferenciador de las visualizaciones
La creación de visualizaciones que representen grandes volúmenes de datos (variables, categorías o cifras) sin utilizar demasiados elementos visuales que puedan distorsionar el análisis y complejizar el entendimiento de los datos es un gran reto. La interactividad juega un rol destacado para evitar esto. Es un atributo que permite segmentar la información, mediante herramientas como los filtros, los cuales son útiles para personalizar conjuntos de datos y transformarlos en gráficos, tablas e indicadores que muestran información específica.
Los dashboards son uno de los ejemplos más claros sobre cómo funciona el componente de interactividad en las visualizaciones. Su uso permite comparar múltiples métricas y presentar los resultados a manera de resumen, resaltando los datos más importantes. El principal objetivo de los dashboards es que sean intuitivos, de manera que los usuarios comprendan su funcionamiento y entiendan las diferentes salidas gráficas que ofrece la herramienta.
Figura 1. Dashboard on Global COVID-19 Tracker
Fuente: Coronavirus (COVID-19) Data Hub
5. Medios de difusión para las visualizaciones
Por último, es necesario definir los medios o canales para difundir las visualizaciones. Cabe resaltar que los medios digitales funcionan muy bien para presentar visualizaciones dinámicas que pueden ser embebidas en sitios web, mientras que las visualizaciones estáticas, encuentran en los reportes o infografías impresas una gran opción.

En la actualidad, el portal web Data República funciona como un espacio colaborativo en el que los diferentes actores de América Latina y el Caribe pueden construir y publicar historias con datos que contienen diferentes formatos visuales, como por ejemplo, los dashboards, con el fin de generar nuevo conocimiento que fortalezca los procesos de toma de decisiones en relación con el cumplimiento de los ODS.
consideraciones finales
El uso de visualizaciones facilita la presentación de los datos, en especial cuando se dispone de grandes volúmenes de información. Sin embargo, un error común es saturar las visualizaciones con datos en exceso y confundir al usuario, dificultar el entendimiento y causar interpretaciones erróneas. Por este motivo, se aconseja priorizar qué información es relevante para el ejercicio de visualización y determinar qué vale la pena, o no, visualizar.
Crear visualizaciones requiere esfuerzo y planeación, requiere de táctica y habilidad para comunicar de manera efectiva; pero esto se logra cuando el visualizador se pone en el lugar del usuario final, y entiende sus necesidades y limitaciones.