viernes, 13 de abril de 2007

Hablemos de datos



Hola calamares.

Desde que conozco con algo más de detalle el tratamiento digitalizado de imágenes, mi concepto sobre cuáles son imágenes desechables ha sufrido cambios. El ejemplo es aquella fotografía que descuadramos al tomarla y antes de eliminarla vemos que es posible ampliar y seleccionar un fragmento que pasamos a utilizar como fondo de pantalla.

Pero eso es sólo el comienzo: imágenes desenfocadas son filtradas -hallar bordes, aplicar trazos de plumilla, pixelizar...- y aparecen maravillas insospechadas! Es genial! Desde el día en que manipulé mi primera foto chunga y obtuve mi primer resultado decente, no hay imagen mala para mí. Esto supone una cuota extra en el sistema de almacenamiento, pero a cambio, la cantidad de imágenes que puedo utilizar ha crecido de manera increíble.

La moraleja es que los datos pueden aparecer en un mensaje cualquiera -entended la idea de mensaje dentro del marco de la teoría de la información- si se extraen con la herramienta adecuada, y se sigue una metodología correcta. Mensajes desechados por carecer de información utilizable pasan a tenerla cuando aparecen metodologías novedosas que utilizan técnicas de reciente creación. Se me viene a la cabeza el radical cambio que en el ámbito del derecho penal ha supuesto la utilización de las técnicas de identificación de individuos por su material genético mediante su comparación con el ADN de muestras biológicas catalogadas en el proceso penal como pruebas, cuya obtención se basa en la técnica de reacción en cadena de la ADNpolimerasa.

¿Es esto generalizable? En mi humilde opinión, sin duda. Una técnica novedosa y una metodología de extracción de datos adecuada pueden obrar maravillas, mostrando información oculta hasta entonces en un mensaje desechado.

Pero hablemos del tamaño, que también importa aquí. ¿Qué pasa cuando lo que se obtiene es una serie incompleta? ¿A la basura con ella? No, XD. No tireis nada calamares. El papel emborronado de hoy es oro mañana. La lucha de hoy día es convencer que si la minería de datos les funciona a las aseguradoras y a los bancos, también a nosotros. No podremos aplicar según qué tipo de estadísticos, pero las tendencias y los patrones son el diamante en bruto de las grandes series de datos, series que como ya sabréis, hay quien está dispuesto a pagarlas para extraerles la valiosa info.

Es por ello que hay que convencer a los clásicos de la información (es) tabulada que existe algo más allá de Cuenca. Que ahora podemos ir a Estocolmo por un precio realmente barato, y que lo que podemos ver desde allí puede ser tan válido como desde casa.

Saludos cefalópodos.

No hay comentarios: