25 diciembre 2008

Los límites de las folksonomías

La verdad es que me llamó la atención el cambio de diseño de 11870.com, uno de los sitios españoles que sigo con atención, pero no tanto por el cambio en sí, sino por lo que tiene detrás: la confesión de que el sistema basado en folksonomías no era adecuado, y resultaba necesario suplementarlo con una categorización del contenido. En su explicación del tema, Jesús Encinar venía a decir que “2.500 años de historia de las bibliotecas no están equivocadas”,  que “una categorización de los contenidos es necesaria”. Según la experiencia de 11870, la folksonomía era una gran ayuda para el buscador, pero no ayudaba a evitar falsos positivos y falsos negativos en la generación de resultados.

¿Supone esta experiencia un descrédito para el desarrollo de las folksonomías o etiquetado colaborativo, uno de los bastiones sobre los que se apoya la llamada Web 2.0 para el manejo de los contenidos? Según la teoría, las folksonomías resultan ideales para clasificaciones inceptivas, que parten de contenidos aportados por los usuarios, en un esquema en el que resultaría difícil obtener una productividad similar proveniente de fuentes estructuradas. Los problemas surgen por inconsistencia: un origen diverso condiciona criterios diferentes en la asignación de etiquetas, lo que en ocasiones acaba derivando en inconsistencias, sinonimias, homonimias, polisemias o, en general, la falta de homogeneidad y de coherencia.

El balance, por tanto, está entre el aporte de contenidos y el orden de los mismos: sistemas de aporte de contenidos estructurados, procedentes de una o pocas fuentes, y clasificados por expertos frente a sistemas en los que muchas fuentes independientes aportan contenidos de manera no estructurada. Si busco fotos en Flickr partiendo de una palabra clave determinada, encontraré sin duda lo que busco, pero rodeado de un cierto nivel de ruido correspondiente a las ocasiones en que un usuario ha utilizado ese mismo término con un criterio diferente al mío. El balance es el que es, no se puede tener lo mejor de los dos mundos: si se aspira a tener un catálogo de contenidos impóluto y sin falsos positivos o negativos, no se puede optar por la categorización exclusiva por los usuarios. Si se espera obtener un catálogo grande con un coste bajo, no se puede depender únicamente del aporte estructurado. Es lo que hay. Para buscar soluciones de compromiso, están el conjunto de soluciones en el que se inscribe la que ha tomado 11870: soluciones mixtas en las que una taxonomía se superpone a una folksonomía. En la práctica, ni más ni menos que una folksonomía en la que determinadas etiquetas están estructuradas por expertos y reservadas para un uso determinado. Una folksonomía con determinados vocabularios controlados. ¿Contradice eso de alguna manera el espíritu de la Web 2.0? En absoluto, ni para el más purista. Simplemente, opta por suponer un margen de paciencia determinado a sus usuarios - los servicios de directorio no son únicos ni están sujetos a importantes barreras de salida -  y por intentar evitar un número elevado de resultado erróneos que hagan que éstos decidan acudir a un servicio similar de la competencia. Si 11870 aspira a convertirse en “el directorio generado por los usuarios”, parece razonable que determinadas etiquetas - las más genéricas o las utilizadas como primer filtro de manera más habitual - estén reservadas y categorizadas de una manera más rígida que otras, para asegurar un uso adecuado de las mismas. Reservar determinadas etiquetas y categorizarlas no hace que 11870 se parezca a una biblioteca, simplemente fija unos criterios determinados y mantiene la libertad de los usuarios para todas las demás. Después de todo, lo que un usuario busca en 11870 y lo que podría determinar una hipotética ventaja competitiva de este servicio de directorio no es la lbertad de asignación de las categorías principales de búsqueda, sino prácticamente “todo lo demás”: las evaluaciones, las opiniones, las calificaciones, las fotos, etc.  Desde mi punto de vista, una decisión que para nada traiciona la idea original, y que seguramente aporte mucho valor.

(Enlace a la entrada original - Licencia)

0 comentarios:

Publicar un comentario

ATENCIÓN: Google ha metido en Blogger un sistema antispam automático que clasifica como spam casi lo que le da la gana y que no se puede desactivar.

Si después de hacer tu comentario este no aparece, no se trata del espíritu de Dans que anda censurando también aquí, es que se ha quedado en la cola de aceptación. Sacaré tu mensaje de ahí tan pronto como pueda, si bien el supersistema este tampoco me avisa de estas cosas, por lo que tengo que estar entrando cada cierto tiempo a ver si hay alguno esperando. Un inventazo, vaya.