Información basura

De frikis/Curiosidades — 21/10/2004 @ 03:11

Hoy he intentado editar un fichero rápidamente para apuntar una cosa. ‘la’ estaba ya usado, ‘lala’ también y por supuesto ‘lalala’… ¿y ‘lalalala’? ¡Arggg!

-rw-r--r--  1 bisho users    203 2004-06-30 11:43 la-rw-r--r--  1 bisho users    337 2004-06-30 12:06 lala-rw-r--r--  1 bisho users    321 2004-06-20 16:18 lala~-rw-r--r--  1 bisho users  15590 2004-09-13 06:02 lalala-rw-r--r--  1 bisho users  15701 2004-09-13 05:02 lalala~-rw-r--r--  1 bisho users   5717 2004-10-20 02:55 lalalala-rw-r--r--  1 bisho users   4497 2004-10-20 02:45 lalalala~-rw-r--r--  1 bisho users   5902 2004-10-20 02:58 lalalala.html-rw-r--r--  1 bisho users   5934 2004-10-20 02:55 lalalala.html~-rw-r--r--  1 bisho users 303864 2003-07-11 16:24 lalala.ps-rw-r--r--  1 bisho users   2253 2004-06-13 20:23 lalala.txt-rw-r--r--  1 bisho users    795 2003-05-24 23:43 lala.txt-rw-r--r--  1 bisho users  55427 2004-09-08 02:24 kk.pdf-rw-r--r--  1 bisho users  40919 2004-09-08 02:24 kk.ps-rw-r--r--  1 bisho users    468 2002-03-13 18:08 cosa.c-rw-r--r--  1 bisho users    270 2003-04-24 21:50 cosa.php-rw-r--r--  1 bisho users     79 2003-04-03 14:36 cosas.txt-rw-r--r--  1 bisho users    451 2003-10-01 12:48 cosa.xml
-rw-r--r--  1 bisho users    251 2003-10-01 13:25 cosa.xsl

Al final he podido guardar la nota que quería en ‘arggggg.txt’, y tras acabar he borrado el fichero prestamente para que no me vuelva a pasar. Entonces he pensado en poner un poco de orden en el caos de lala’s de mi directorio, pero la pereza ha sido tal, que he acabado borrando todos los ficheros sin contemplaciones.

Eso me ha hecho reflexionar sobre el valor de la información, en estos días que estoy con el pensamiento en interfaces de búsqueda y viendo las propuestas de diseño de una aplicación de Linux para gestionar fotos con mucho futuro, F-Spot.

Información binariaEs curioso que la información es tanto más valiosa cuanto mejor está catalogada y ordenada. Los datos en la era de la información no son más que ristras de ceros y unos aparentemente aleatorios, y sin clasificar no nos sirven de nada, por preciados que fueran en un principio. ¿De qué vale un tesoro pirata si no lo encontramos?. Me hace recordar el final de la época de los disquetes de 3½. Había un momento en el que te daba igual los contenidos de un disquete, en vez de mirar los ficheros e intentar evaluar si conservarlos o no, los borrabas directamente: Si no los habías necesitado en meses, y de todas formas no te ibas a poner a buscar nada en disquetes, no tienen importancia.

No hay más que ver por ejemplo a Google. Probablemente una de las herramientas más usadas de internet, un valor de mercado enorme, el servicio más útil. Qué proporciona, ¿información? No. Sólo ordena, clasifica, y muestra información ya existente. Y eso es lo más importante.

Internet

Últimamente no dejan de aparecer proyectos e ideas para intentar solucionar el galimatías de la sociedad de la información. Y todos están de acuerdo: el enemigo es la propia información. La información superflua, la indeseada, la excesiva… La información basura. El horror que supone buscar algo en nuestros discos duros de gigas, en internet, en nuestro correo… Nuestros cerebros no se amplían, y sómos capaces de asimilar una cierta capacidad de información, pero cada vez almacenamos más y más en nuestros ordenador, la relación señal-ruido decrece.

En el ordenador personal está MS con su WinFS (retrasado, parece que se dieron cuenta de que no es tan fácil como parece), está Google con su Google Desktop (aún un poco verde) y hay proyectos en Linux muy novedosos y punteros: Beagle, Dashboard (ya un poco abandonado), Storage (también algo abandonado). También están las aplicaciones más específicas, en especial en el terreno de las fotos (que es en el que estoy más informado) está Google con su recién comprado Picasa, Adobe con su PhotoshopAlbum y en linux también los interesantes Gthumb, y el prometedor F-Spot.

El principal problema de la clasificación de la información en el escritorio es que debe molestar lo menos posible al usuario. Si se exige esfuerzo, tenderá a hacer como yo, y llenar su home de ficheros ‘lala’ sin ningún orden ni concierto.

Especialmente difícil es la clasificación de imágenes, que no contienen tanta información interpretable por el ordenador como por ejemplo un documento word, apenas una fecha, el fabricante de la cámara, e información de exposición de la foto… A mi me suele llevar del orden de una hora clasificar, limpiar, afinar y ordenar fotos de una galería. Afortunadamente en el terreno de las fotos soy consciente de su importancia y sí que tengo todo clasificado y ordenado :). He trabajado programando buscadores de imágenes, con casi cientos de keywords asociados a cada imagen para permitir búsquedas y tengo una idea clara de enorme esfuerzo que requiere dicha clasificación. Un usuario normal de ordenador no va a hacer ese esfuerzo con las imágenes del último cumple de mengano.

En cuanto a la web las cosas son muy diferentes. Se puede invertir mucho tiempo en sistemas de clasificación de la información, en forma de herramientas o aplicaciones que facilitan la introducción de información ordenada. En este ámbito está entrando fuerte el XML en general, de mano del W3. Algunos ejemplos de formatos XML que han triunfado están todos los de sindicación, RSS, RDF, Atom, etc… El W3 está promoviendo la web semántica que trata de extender ese modelo de datos estructurados, clasificados, con contenido semánticos de los formatos de sindicación al resto de la web. Está habiendo mucha investigación sobre estos temas, tanto de web semántica como de cómo extraer mejor la semántica de la web actual, como hace google y otros buscadores. Son temas muy interesantes.

La información (ordenada) es poder.

Y parece que esto no se puede extrapolar al mundo real, pero no es ni mucho así. Como están demostrando las sendas comisiones de investigación, las pistas, la información, los indicios de los antentados de 11-S y 11-M estaban allí, se tenían, pero por no estar bien clasificada esa información se perdió entre un mar de documentos y otras informaciones superfluas. :(

1 Comment »

The URI to TrackBack this entry is: http://blogs.eurielec.etsit.upm.es/freedreams/posts/2004/10/21/informacin-basura/trackback/

  1. muy mal

    Comment by andres — 3/11/2011 @ 17:06

RSS feed for comments on this post.

Leave a comment

(required)

(required)



authimage


Line and paragraph breaks automatic, e-mail address never displayed, HTML allowed: <a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

Diario de sueños de Guillermo Pérez (aka bisho)