Información basura
Hoy he intentado editar un fichero rápidamente para apuntar una cosa. ‘la’ estaba ya usado, ‘lala’ también y por supuesto ‘lalala’… ¿y ‘lalalala’? ¡Arggg!
-rw-r--r-- 1 bisho users 203 2004-06-30 11:43 la-rw-r--r-- 1 bisho users 337 2004-06-30 12:06 lala-rw-r--r-- 1 bisho users 321 2004-06-20 16:18 lala~-rw-r--r-- 1 bisho users 15590 2004-09-13 06:02 lalala-rw-r--r-- 1 bisho users 15701 2004-09-13 05:02 lalala~-rw-r--r-- 1 bisho users 5717 2004-10-20 02:55 lalalala-rw-r--r-- 1 bisho users 4497 2004-10-20 02:45 lalalala~-rw-r--r-- 1 bisho users 5902 2004-10-20 02:58 lalalala.html-rw-r--r-- 1 bisho users 5934 2004-10-20 02:55 lalalala.html~-rw-r--r-- 1 bisho users 303864 2003-07-11 16:24 lalala.ps-rw-r--r-- 1 bisho users 2253 2004-06-13 20:23 lalala.txt-rw-r--r-- 1 bisho users 795 2003-05-24 23:43 lala.txt-rw-r--r-- 1 bisho users 55427 2004-09-08 02:24 kk.pdf-rw-r--r-- 1 bisho users 40919 2004-09-08 02:24 kk.ps-rw-r--r-- 1 bisho users 468 2002-03-13 18:08 cosa.c-rw-r--r-- 1 bisho users 270 2003-04-24 21:50 cosa.php-rw-r--r-- 1 bisho users 79 2003-04-03 14:36 cosas.txt-rw-r--r-- 1 bisho users 451 2003-10-01 12:48 cosa.xml -rw-r--r-- 1 bisho users 251 2003-10-01 13:25 cosa.xsl
Al final he podido guardar la nota que quería en ‘arggggg.txt’, y tras acabar he borrado el fichero prestamente para que no me vuelva a pasar. Entonces he pensado en poner un poco de orden en el caos de lala’s de mi directorio, pero la pereza ha sido tal, que he acabado borrando todos los ficheros sin contemplaciones.
Eso me ha hecho reflexionar sobre el valor de la información, en estos días que estoy con el pensamiento en interfaces de búsqueda y viendo las propuestas de diseño de una aplicación de Linux para gestionar fotos con mucho futuro, F-Spot.
Es curioso que la información es tanto más valiosa cuanto mejor está catalogada y ordenada. Los datos en la era de la información no son más que ristras de ceros y unos aparentemente aleatorios, y sin clasificar no nos sirven de nada, por preciados que fueran en un principio. ¿De qué vale un tesoro pirata si no lo encontramos?. Me hace recordar el final de la época de los disquetes de 3½. Había un momento en el que te daba igual los contenidos de un disquete, en vez de mirar los ficheros e intentar evaluar si conservarlos o no, los borrabas directamente: Si no los habías necesitado en meses, y de todas formas no te ibas a poner a buscar nada en disquetes, no tienen importancia.
No hay más que ver por ejemplo a Google. Probablemente una de las herramientas más usadas de internet, un valor de mercado enorme, el servicio más útil. Qué proporciona, ¿información? No. Sólo ordena, clasifica, y muestra información ya existente. Y eso es lo más importante.

Últimamente no dejan de aparecer proyectos e ideas para intentar solucionar el galimatías de la sociedad de la información. Y todos están de acuerdo: el enemigo es la propia información. La información superflua, la indeseada, la excesiva… La información basura. El horror que supone buscar algo en nuestros discos duros de gigas, en internet, en nuestro correo… Nuestros cerebros no se amplían, y sómos capaces de asimilar una cierta capacidad de información, pero cada vez almacenamos más y más en nuestros ordenador, la relación señal-ruido decrece.
En el ordenador personal está MS con su WinFS (retrasado, parece que se dieron cuenta de que no es tan fácil como parece), está Google con su Google Desktop (aún un poco verde) y hay proyectos en Linux muy novedosos y punteros: Beagle, Dashboard (ya un poco abandonado), Storage (también algo abandonado). También están las aplicaciones más específicas, en especial en el terreno de las fotos (que es en el que estoy más informado) está Google con su recién comprado Picasa, Adobe con su PhotoshopAlbum y en linux también los interesantes Gthumb, y el prometedor F-Spot.
El principal problema de la clasificación de la información en el escritorio es que debe molestar lo menos posible al usuario. Si se exige esfuerzo, tenderá a hacer como yo, y llenar su home de ficheros ‘lala’ sin ningún orden ni concierto.
Especialmente difícil es la clasificación de imágenes, que no contienen tanta información interpretable por el ordenador como por ejemplo un documento word, apenas una fecha, el fabricante de la cámara, e información de exposición de la foto… A mi me suele llevar del orden de una hora clasificar, limpiar, afinar y ordenar fotos de una galería. Afortunadamente en el terreno de las fotos soy consciente de su importancia y sí que tengo todo clasificado y ordenado :). He trabajado programando buscadores de imágenes, con casi cientos de keywords asociados a cada imagen para permitir búsquedas y tengo una idea clara de enorme esfuerzo que requiere dicha clasificación. Un usuario normal de ordenador no va a hacer ese esfuerzo con las imágenes del último cumple de mengano.
En cuanto a la web las cosas son muy diferentes. Se puede invertir mucho tiempo en sistemas de clasificación de la información, en forma de herramientas o aplicaciones que facilitan la introducción de información ordenada. En este ámbito está entrando fuerte el XML en general, de mano del W3. Algunos ejemplos de formatos XML que han triunfado están todos los de sindicación, RSS, RDF, Atom, etc… El W3 está promoviendo la web semántica que trata de extender ese modelo de datos estructurados, clasificados, con contenido semánticos de los formatos de sindicación al resto de la web. Está habiendo mucha investigación sobre estos temas, tanto de web semántica como de cómo extraer mejor la semántica de la web actual, como hace google y otros buscadores. Son temas muy interesantes.
La información (ordenada) es poder.
Y parece que esto no se puede extrapolar al mundo real, pero no es ni mucho así. Como están demostrando las sendas comisiones de investigación, las pistas, la información, los indicios de los antentados de 11-S y 11-M estaban allí, se tenían, pero por no estar bien clasificada esa información se perdió entre un mar de documentos y otras informaciones superfluas. :(
1 Comment »
The URI to TrackBack this entry is: http://blogs.eurielec.etsit.upm.es/freedreams/posts/2004/10/21/informacin-basura/trackback/
RSS feed for comments on this post.
muy mal
Comment by andres — 3/11/2011 @ 17:06