25 septiembre 2013

Link rot: la insoportable levedad de la web

IMAGE: lucadp - 123RFUna referencia de Lawrence Lessig me lleva a profundizar un poco en el concepto de link rot, link desth o link breaking: el fenómeno que ocurre cuando aparecen vínculos en la web que apuntan a recursos que ya no están disponibles.

Un problema cuya importancia tiende a ser subestimada: el Error 404 es parte habitual en la vida de cualquier usuario de la red y casi forma parte de una rutina de resignación, pero cuando esos errores afectan cada semana a uno de cada doscientos enlaces, cuando la mitad de los enlaces utilizados en literatura académica no están disponibles diez años después de su publicación, o cuando la mitad de las referencias de jurisprudencia del Tribunal Supremo de los Estados Unidos no funcionan, nos damos cuenta de que, en realidad, estamos prácticamente construyendo toda una fase del desarrollo cultural de la humanidad sobre unas bases inadecuadas.

El problema no tiene una solución sencilla: con la popularización de herramientas que dan lugar a un descenso brutal en las barreras de entrada a la publicación, llegamos a un escenario en el que muchos recursos en la red son creados con una mentalidad puramente coyuntural o simplemente no son sujetos a un mínimo trabajo de mantenimiento. En el caso de publicaciones periódicas, la visión unidireccional es relativamente habitual: modificar la estructura de un recurso para situarlo en un archivo, tras una barrera de pago, o simplemente hacerlo desaparecer para reducir costes de almacenaje y mantenimiento es una práctica desgraciadamente habitual, que no tiene en cuenta el hecho de que la naturaleza de la web lleva a que ese recurso pueda tener importancia no solo por la información contenida en sí mismo, sino también en virtud de las referencias que apuntan a él.

Una serie de iniciativas intentan trabajar para minimizar la criticidad del link rot: además del conocido Internet Archive, que ofrece una especie de limitado “viaje en el tiempo” para poder acceder a capturas de páginas en función de periódicos almacenes en su archivo, surgen otros recursos, como DeadURL.com, que añadidos al inicio de una dirección muerta, intentan acceder a salvaguardas funcionales de la misma en diversos archivos. O herramientas como Evernote, Peeep.us o Instapaper, que generan una copia del recurso en una URL independiente que permanece activa incluso si el recurso original deja de estar disponible. Desde el ámbito académico surge WebCite, un recurso libre de coste sufragado por editores (que ha anunciado que no admitirá más recursos a partir del final de 2013 si no es capaz de alcanzar sus objetivos de financiación), o Perma.cc, gestionado por una serie de bibliotecas universitarias bajo la iniciativa de la Harvard Library Innovation Lab.

Por el lado de los creadores de páginas, es preciso generar una cierta conciencia con respecto al problema: tratar de vincular a recursos con una cierta vocación de permanencia, utilizar repositorios de uso personal con backups de los recursos vinculados mediante herramientas como las citadas, o revisar con cierta regularidad lo publicado con herramientas de detección de enlaces rotos. Una herramienta en desarrollo de IBM, Peridot, permite automatizar la detección de esos enlaces rotos y propone su actualización a partir de una serie de características únicas del documento vinculado. En mi caso, hace ya mucho tiempo que añado la versión en pdf de los artículos que me publican en muchas fuentes, tras haber comprobado que, a lo largo de casi once años de mantener mi blog, una parte significativa de los enlaces, sobre todo los más antiguos, ya no está disponible.

La insoportable levedad de la web puede ser, en muchos de sus determinantes más profundos, una parte de sus características. Pero para algunos casos, desde jurídicos hasta académico-científicos, pasando por editoriales, es un problema que requiere un replanteamiento de muchos factores que habrá que ir anticipando y teniendo en consideración. Pasar de lo más obvio – constatar que hay muchos enlaces rotos – al desarrollo de sistemas y protocolos que permitan al menos atenuar su importancia es parte de una fase de consolidación de la web por la que necesariamente hay que pasar.








(Enlace a la entrada original - Licencia)

0 comentarios:

Publicar un comentario

ATENCIÓN: Google ha metido en Blogger un sistema antispam automático que clasifica como spam casi lo que le da la gana y que no se puede desactivar.

Si después de hacer tu comentario este no aparece, no se trata del espíritu de Dans que anda censurando también aquí, es que se ha quedado en la cola de aceptación. Sacaré tu mensaje de ahí tan pronto como pueda, si bien el supersistema este tampoco me avisa de estas cosas, por lo que tengo que estar entrando cada cierto tiempo a ver si hay alguno esperando. Un inventazo, vaya.