Subscríbete a
Posts
Comentarios

Uno de los mayores problemas de las folksonomías es la gran cantidad de tags similares que usamos para describir el mismo objeto, un problema que surge de falta de un vocabulario controlado que corrija las variantes de plurales/singulares minúsculaes/mayúsculas y las diversas derivaciones de cada término:

blog – blogs – Blog – Blogs – blogging – bloggers …

La ausencia de un control terminológico,que otorga libertad y agilidad al tagging social, repercute en la recuperación de información originando confusiones semánticas y silencio documental.

del.icio.us tag stemmer utiliza el algoritmo de Porter y nos permite conocer las variaciones que hemos utilizado de nuestras tags en todos los recursos que hemos marcado, a través de nuestra cuenta de usuario de del.ici.ous, o conocer todas las variaciones de tags que los lectores han utilizado para marcar un mismo objeto. De lo que se trata es de aplicar técnicas de stemming* y evitar las confusiones semánticas para una misma tag.

Por el momento sólo funciona con términos en inglés, un idioma más sencillo que el español desde el punto de vista morfológico, implementar un del.icio.us tag stemmer en nuestro idioma supongo que será bastante más complicado.

__________________

* El stemming o lematización es el proceso mediante el cual se relacionan morfológicamente las pálabras que comparten la misma raíz, de forma que podamos agrupar las variantes morfológicas de cada término. Hay numerosos estudios sobre el stemming y la recuperación de información, dos artículos sencillos e introductorios a las técnicas de stemming para el español:


Posts relacionados

  • No hay posts relacionados