Limpieza de datos con KNIME

Vídeo

Comparto el workflow de KNIME utilizado para limpiar el registro de casas rurales de Cataluña publicado por la Generalitat de Catalunya.

El workflow desarrolla las siguientes tareas:

  • Normalización nombres de municipios
  • Creación dirección postal completa concatenando dirección, número portal, código postal, municipio y provicia
  • Cálculo de la antigüedad de la casa (en años)
  • Extracción del número de espigas (numérico)
  • Obtención de las coordenadas en el formato utilizado por Google Maps (WGS84)
  • Representación del resultado en OpenStreetMaps

knime_workflow

El resultado obtenido permite hacer una primera representación GIS sobre OpenStreetMaps (OSM):

establecimientos_rurales

Anuncios

El éxito de Womenalia. Mujeres en red

Comparto la presentación de Womenalia por María Gómez del Pozuelo. Un vídeo que resume las principales clave de su éxito:

  • Colaboración
  • Emprendimiento
  • Networking
  • Inspiración
  • Desarrollo profesional
  • Unión
  • Formación

Ofrecidas por un equipo con :

  • Amor
  • Optimismo
  • Perseverancia
  • Formación

Porque, como indica María G. del Pozuelo, “El alma de la empresa está formada por la suma de las almas de todas y cada una de las personas que forman el equipo”

El ecosistema de análisis

Llevo tiempo reflexionando los factores a tener en cuenta en el desarrollo de todo análisis. Hace un par de años, proponía un modelo que combinase técnicas y herramientas de análisis en un entorno creativo.

Un modelo que ha evolucionado y que ahora incorpora tres elementos clave como son los criterios de definición de indicadores, las técnicas de representación escogidas y la habilidad para interrelacionar elementos eficientemente (inteligencia práctica).

Un ecosistema que evoluciona mediante la combinación eficiente de técnicas y herramientas, aplicadas sobre factores medidos con el indicador adecuado y representados con el diseño que permita comprender la situación en una sola hoja.

Un ecosistema donde herramientas y técnicas deben ser escogidas para satisfacer el nivel de significación esperado y donde siempre deberá existir una componente lúdica para revisar y reinventar procesos.