domingo, enero 20, 2008

Calidad de datos en SEXTANTE

La calidad de los datos espaciales es un asunto bastante en boga actualmente, y que ha pasado de ser algo de lo que nadie se preocupaba allá por las épocas iniciales del SIG, a ser algo de gran importancia. Sé que en gvSIG ya se está trabajando para incorporar elementos relacionados con esto, en particular la gestión de metadatos, y, mientras voy acabando otras cosas, estoy dándole vueltas a la relación que puede existir entre la gestión de la calidad de los datos y SEXTANTE como conjunto de herramientas de análisis.

Por una parte, sin duda hay que aprovechar esa estructura de metadatos cuando esté disponible, y añadir metadatos a todos los resultados que genere SEXTANTE, especificando las características de los procesos que han dado lugar a esos resultados. Esto no debería ser difícil, y es más bien un trámite a desarrollar una vez que gvSIG implemente esos elementos de gestión de metadatos.

La parte que más me interesa, no obstante, es la que tiene que ver con análisis relacionado directamete con la evaluación de la calidad. Estoy haciendo una pequeña lista con ideas, y la verdad es que hay muchas cosas que pueden implementarse y, lo que es más importante, son cosas que no aparecen en los SIG habitualmente.

Por ejemplo, no hay programa de estadística que no incluya alguna formulación para detección de outliers, pero encontrar un SIG con herramientas para detectar outliers espaciales (o incluso no espaciales) es bastante raro.

Análisis como los de modelización de la incertidumbre a partir de simulaciones condicionales son de gran interés, y complementan a muchos de los algoritmos de análisis que hay en SEXTANTE, en especial a los de análisis del terreno y similares. Éstos se pueden desarrollar de forma sencilla utilizando el modelizador y los procesos por lotes, aunque quizás sería de interés ofrecerlos de una forma más directa y simple. Para el que no sepa de que va esto de las simulaciones, mi buen amigo Tomislav Hengl tiene en esta web una explicación breve pero ilustrativa al respecto. (Por cierto, que Elsevier está por fin a punto de publicar el libro editado por Tom -- "Geomorphometry. Concepts, software and applications"-- al que corresponde esa web, y en el que yo escribo dos capítulos y hay uno dedicado exclusivamente a la modelización de la incertidumbre en los MDEs).

Otros procesos, como los que he mencionado para la detección de outliers, requerirán hacer nuevos desarrollos, aunque gran parte de ellos no son complejos.
No sé aún cuando me pondré a implementarlos, pero es un área de trabajo que no hay que perder de vista, porque puede aportar un empujón importante para introducir la calidad de datos en el entorno de un SIG de escritorio, y eso es algo que sin duda tiene gran interés. ¿Alguno de los lectores del blog tiene alguna idea sobre formulaciones de este tipo que puedan implementarse dentro de SEXTANTE? Toda sugerencia es bienvenida...

No hay comentarios: