Más sobre datos, aplicaciones y ciudades

Ayer escribí un poco sobre mi interés creciente por el tema del manejo de datos y cómo podemos extraer de la enorme cantidad de datos que capturamos (o que deberíamos capturar) información significativa para mejorar nuestras condiciones de vida.

Hay muchas aplicaciones en torno a esto que se están explorando para monitorear y optimizar diversos sistemas públicos en ciudades. De hecho, hace un tiempo compartí aquí un ejemplo de cómo Copenhague estaba utilizando bicicletas como sensores baratos para monitorear condiciones climáticas y de tráfico en la ciudad. Ahora encontré un artículo en Mashable sobre una serie de ciudades que están abriendo a sus ciudadanos sus bases de datos para que construyan aplicaciones utilizando la información que está allí sin explotar, para mejorar las condiciones de vida en la ciudad.

Major city governments across North America are looking for ways to share civic data — which normally resides behind secure firewalls — with private developers who can leverage it to serve city residents via web and mobile apps. Cities can spend on average between $20,000 and $50,000 — even as much as $100,000 — to cover the costs of opening data, but that’s a small price to pay when you consider how much is needed to develop a custom application that might not be nearly as useful.

Hay varias razones por las cuales esto es una gran iniciativa:

  • Fomenta la transparencia y la participación ciudadana. Por un lado, evidencia de parte del gobierno de la ciudad la disposición de abrir sus datos al público, y al brindar la oportunidad de crear maneras accesibles de interpretar esta información, permite que un número mayor de personas pueda entender y participar de la gestión municipal.
  • Permite mejorar las condiciones de vida en la ciudad. Creando aplicaciones que contextualizan datos sobre tráfico, criminalidad, educación, medio ambiente, etc., se tienen elementos mucho mejores para tomar decisiones en materia de políticas públicas. Éste es uno de los mejores rasgos de jugar SimCity: uno puede ver cómo cambios en la zonificación industrial afectan a lo largo del tiempo los patrones de contaminación o de tráfico en una zona de la ciudad, y puede adoptar medidas en función a eso. Con mejores fuentes de datos, lo mismo puede hacerse con ciudades reales.
  • Desarrolla un mercado y una base de talento locales. Al abrir las bases de datos para que los ciudadanos jueguen con ellas, se fomenta el desarrollo de habilidades en construcción de aplicaciones a nivel local, que luego pueden ser contratadas por la misma gestión municipal o por el sector privado o quien fuera. En términos simples, se genera un espacio de aprendizaje muy accesible donde los ciudadanos pueden aprender a hacer aplicaciones basadas en datos y empezar a hacerse un nombre con lo cual luego puede empezar a forjarse un mercado local en este rubro.

Por todo esto, no sólo no es descabellado, sino que sería también deseable explorar este tipo de aplicaciones en una ciudad como Lima. En Lima, sin embargo, quizás haya que empezar por capturar datos y consolidarlos en bases de datos accesibles, algo que no es imposible pero que ciertamente arrastra un costo. Las unidades de transporte público, por ejemplo, podrían estar equipadas con sensores que monitoreen su recorrido a lo largo del día, junto con una serie de factores además del tiempo, como condiciones medioambientales o contaminación sonora. Con una serie de sensores bien ubicados en líneas estratégicas, uno podría construirse una figura razonable de los patrones de tráfico, los cuellos de botella y los focos de contaminación en puntos clave de la capital.

(Obviamente esta información y toda su riqueza serían seguramente objetadas por gremios que no quieren ser monitoreados, ya que eso evidenciaría, expondría y documentaría las infracciones que cometen cotidianamente. A mi juicio, una razón más por la cual implementar algo así, a pesar del costo político.)

Otro lugar muy importante donde podría ensayarse esto es en la mejora de la seguridad ciudadana, construyendo sistemas que hagan extremadamente fácil para una persona reportar incidentes o crímenes y empezar a compilar toda esa información de manera sistemática. Debidamente organizada, esto permitiría construir un mapa de criminalidad e inseguridad en Lima que correlacionara no solamente ubicación geográfica, sino también hora, fecha, contexto, y todas las demás variables ambientales cuya influencia en la tasa de criminalidad podría luego empezar a explorarse. Ésta sería, a mi juicio, una inversión mucho más razonables y realista que los gastos más bien aparatosos y propagandísticos que muchos municipios hacen para dar la impresión de que hacen algo por la seguridad ciudadana – instalar cámaras de vigilancia puede estar muy bien, pero a menos que se tenga un plan integral y sistemático para hacer algo con esa nueva fuente de información, en realidad es tirar plata al tacho, jugar con las expectativas de la población y solamente intentar crear una falsa sensación de seguridad.

(Imaginen por ejemplo una aplicación que correlacione un mapa de criminalidad con la posición de uno vía GPS, y le emita una alerta vía celular cuando uno se acerca o se encuentra en un área de alta peligrosidad, junto con una serie de recomendaciones. Quizás son cosas que uno viviendo en una ciudad más o menos internaliza, pero que podría tener enormes aplicaciones, por ejemplo, para el turismo.)

Datos

Una de mis obsesiones recientes es con el manejo de datos, una de tantas cosas que me fascinan y de las que no sé ni remotamente lo suficiente.

Hoy día tenemos mayor capacidad que nunca para capturar, almacenar y procesar todo tipo de datos, y de hecho lo hacemos todo el tiempo y ni siquiera nos damos cuenta. Todos esos datos se almacenan en miles de bases de datos, usualmente aisladas, usualmente perdidas y usualmente poco explotadas. Pero lo que se puede hacer con esos datos es espectacular y es algo en lo que poco a poco estamos ganando terreno.

Permítanme llevar su atención a la obra de Hans Rosling, quien se ha vuelto popular en los últimos años principalmente a través de sus presentaciones en las charlas TED. Rosling es alguien que no solamente está trabajando en el problema de cómo extraer información y conocimiento relevantes a partir de cadenas de datos en apariencia sin relación y conexión, sino además en el problema posterior, de cómo ilustrar y presentar esa información y esas conexiones de maneras que muestren su relevancia a un público general y amplio, y sirvan para informar a la opinión pública.

Éste es uno de los temas comunes de Rosling, presentado para la BBC:

Ésta es la charla TED del 2006 donde Rosling presenta su trabajo con la visualización de datos estadísticos a partir de información médica en los últimos doscientos años:

Es espectacular. Y es ilustrativo porque cuando uno empieza a mapear la manera como cambian los datos a través del tiempo, y ése es justamente el punto de Rosling, se empiezan a desmontar una serie de mitos y preconcepciones que uno puede tener respecto al desarrollo global.

Ésta es una de las cosas que más me interesan últimamente: cómo extraer información relevante, de manera sistemática, a partir de la multiplicidad de datos que nos rodea. Esto es especialmente relevante porque ahora tenemos sensores en todas partes, y podemos empezar a mapear información con dispositivos tan sencillos como un celular.

Es muy poco lo que yo sé de estadística, pero sé lo suficiente como para saber que en un futuro no muy lejano (que se parece más bien al presente), el manejo de datos y estadísticas se convertirá en una de esas habilidades fundamentales para navegar la realidad. Como señalaba McLuhan hace ya varias décadas, la época de la energía eléctrica, de la automatización, está marcada por el movimiento de la actividad económica y de la fuerza de trabajo hacia el reconocimiento y la detección de patrones. Cuando se rompe con la linealidad del trabajo mecánico con la aparición de la automatización, tenemos que reestablecer nuestra relevancia con actividades de un valor más alto, y allí donde los datos son abundantes, lo que es más bien escaso es nuestra capacidad para digerirlos y procesarlos de manera interesante.

Por ejemplo – hace unos días descubrí que el Banco Central de Reserva del Perú publica una enorme cantidad de indicadores económicos y financieros, y que mantiene una base de datos de acceso público con información de casi dos décadas. Información que recoge los cambios en las principales variables económicas del desarrollo económico peruano de los últimos años, y esto es excelente, y espero que sean muchas más las agencias del gobierno que publican este tipo de información. Con acceso a estos datos, con un poco de creatividad y un poco de tiempo, podríamos empezar a extraer una serie de conclusiones sumamente interesantes, si empezamos a cruzar los cambios en los indicadores con, por ejemplo, acontecimientos históricos nacionales e internacionales, movimientos políticos, procesos sociales, etc. Son muchas las conclusiones que podríamos empezar a trazar, simplemente trazando correlaciones entre diferentes conjuntos de datos.