Subscríbete a
Posts
Comentarios

LukeW analiza las similitudes que presenta el diseño de la interfaz de Google y Yahoo para sus diferentes productos: Google vs. Yahoo! Interface Design:

Es dificil encontrar diferencias, los patrones se repiten, tan sólo se muestran distinciones en los grupos y en la búsqueda de productos, donde Yahoo Shopping presenta un enfoque más empresarial, facilitando la búsqueda de productos por diferentes características (browsing y searching, comparación de precios…), mientras que Froogle sigue fiel al estilo minimalista de Google: cajita de búsqueda simple.

Meme literario

ReinaMora me pasa el testigo y en su afán de conocer nuestras pretensiones lectoras para este verano, se pregunta que 5 libros me leeré este verano,

  • El relato incompleto de Antonio Ventura
  • La misteriosa llama de la Reina Loana de Umberto Eco
  • La mujer habitada de Gioconda Belli
  • Una llamada tuya bastará para sanarme de Gloria Bosch
  • La historia del arte de Gombrich

Es curioso ésto de confesar nuestras lecturas, decía Graham Greeene que nuestra vida está hecha más por los libros que leemos que por la gente que conocemos, y no iba muy desencaminado… quizá por eso algunos forran sus libros para leerlos “en público”, y no porque se estropeen, sino para evitar el tropel de curiosos (mea culpa) que no pueden evitar preguntarse, “qué estará leyendo”…

Desnudadas mis ansias literarias para Carmel, ahora yo quiero conocer qué leerán éstos 5 grandes lectores que en otras ocasiones, con un inmejorable criterio, me han recomendado buenos libros…

Uno de los mayores problemas de las folksonomías es la gran cantidad de tags similares que usamos para describir el mismo objeto, un problema que surge de falta de un vocabulario controlado que corrija las variantes de plurales/singulares minúsculaes/mayúsculas y las diversas derivaciones de cada término:

blog – blogs – Blog – Blogs – blogging – bloggers …

La ausencia de un control terminológico,que otorga libertad y agilidad al tagging social, repercute en la recuperación de información originando confusiones semánticas y silencio documental.

del.icio.us tag stemmer utiliza el algoritmo de Porter y nos permite conocer las variaciones que hemos utilizado de nuestras tags en todos los recursos que hemos marcado, a través de nuestra cuenta de usuario de del.ici.ous, o conocer todas las variaciones de tags que los lectores han utilizado para marcar un mismo objeto. De lo que se trata es de aplicar técnicas de stemming* y evitar las confusiones semánticas para una misma tag.

Por el momento sólo funciona con términos en inglés, un idioma más sencillo que el español desde el punto de vista morfológico, implementar un del.icio.us tag stemmer en nuestro idioma supongo que será bastante más complicado.

__________________

* El stemming o lematización es el proceso mediante el cual se relacionan morfológicamente las pálabras que comparten la misma raíz, de forma que podamos agrupar las variantes morfológicas de cada término. Hay numerosos estudios sobre el stemming y la recuperación de información, dos artículos sencillos e introductorios a las técnicas de stemming para el español:

El almacén de Google

La memoria histórica de Google donde se almacenan cómo y cuándo se realizan sus búsquedas o el registro de utilización de otros servicios, empieza a preocupar a los expertos en temas de privacidad,

En una época en la que las bibliotecas borran los registros de los préstamos apenas un libro es devuelto, también Google debería borrar los suyos tras un cierto periodo, para proteger a sus usuarios, sostienen los críticos.

Sin embargo Google no escatima en gastos para seguir archivando todos esos datos durante años, información que podría ser utilizada con fines “poco éticos” o inquisitorios…

Más en: La vasta memoria de Google suscita temores sobre la privacidad

Meme musical

Testigo recibido de: Koon y Tintachina

Tamaño total de los archivos de música en mi ordenador: 5,1 Gb en el pc de sobremesa 3, 10 Gb en el portátil

Último disco que me compré: Come Fly With Me de Michael Buble

Canción que estoy escuchando ahora: La paz de tus ojos de La Oreja de Van Gogh

5 canciones que escucho un montón o con algún significado para mí:

  • Cigarettes and Chocolate Milk de Rufus Wainwright
  • La copa rota de los Los Rodriguez
  • Unfaithful de Jan A.P. Kaczmarek
  • Con los años que nos quedan por vivir de los Lunes
  • El Adagio de Albinoni

5 personas que tendrán que recoger el testigo y poner el mismo post, si no lo han puesto ya:

Start.com

Todos nos acordamos del sistema utilizado por Google para probar las betas de sus sistemas, ya que hemos entrado en Orkut y Gmail con invitaciones que funcionaban como un boca a boca, jugando con el elitismo de poder ser uno de los afortunados en “entrar dentro”.

Yahoo, con el sistema de Y360º, también ha seguido sus pasos, pero hoy me he encontrado con que MSN ha decidido probar un método más original y útil para sus intereses…un cuestionario¡ Si quieres mirar la preview de su nuevo agregador, solo tienes que contestar a unas “sencillas” preguntas para lo que te pone un enlace a su buscador msn al lado, para que de paso, lo pruebes. (Os dejo las respuestas, por si os cuesta encontrar alguna)

Cada vez más, Msn intenta potenciar su buscador que está a años luz en número de usuarios del top de los buscadores y es un trozo muy jugoso en el pastel del dinero en internet. Este se suma a otros signos como la inclusión de productos estrella como la Encarta, que creo q es el mejor valor del buscador de microsoft (y que por cierto ofrece 2 horas de consulta gratis) y el Messenger, que ha incluido en esta última version un boton de búsqueda (ver ejemplo) para encontrar información mientras conversas

start

La integración de servicios y de contenidos es lo primordial. En este caso, Yahoo y Msn fueron los primeros en dar rss en las búsquedas, pero de momento, Yahoo lleva ventaja. Myyahoo es el más completo, aunque no sea santo de mi devoción, pues Google solo tiene un pequeño soporte en gmail ,y msn sigue con Start.com con el he empezado el post y del que os dejo un pantallazo. Lo más destacable de lo que he podido ver en esta preview es que incorpora el historial de búsquedas realizadas, que supongo q se podran añadir como un feed más (¿pin to dahsboard?), y que también supongo que en un futuro se verá complementado con un buscador de bitácoras. Visto en: rsscompendiumblog

La frase de la semana

“La biblioteca no es un santuario para venerar libros. No es un templo donde deba quemarse el incienso literario o donde la devoción de uno hacia el libro encuadernado se exprese en un ritual. Una biblioteca, para adaptar la famosa metáfora de Sócrates, debería ser la sala de partos para el nacimiento de ideas -un lugar donde la historia se hace vida”.

Norman Cousins (1915-1990), escritor, editor, diplomático y activista en los movimientos pacifistas y anti-nucleares.

Combinando facetas y etiquetas

Peter Van Dijck plantea How to combine tags with facets una forma de combinar los metadatos generados por el usuario con los generados por los editores: diseñar facetas que serán alimentadas por los usuarios con sus tags, aumentando así la findability.

Su idea se basa en diseñar un esquema colaborativo entre los arquitectos de la información y los usuarios, aunando los esfuerzos y consistencia del trabajo de los especialistas con la facilidad y libertad de marcar con etiquetas los objetos por parte de los usuarios.

La limitación está en que el usuario sólo podrá asignar la misma tag en el mismo objeto a una única faceta, Peter lo ejemplifica con la siguiente imagen:

Tags y facetas

Ésto acabaría con los problemas de ambigüedad, el famoso ejemplo de la etiqueta “apple”, no podría estar adscrita en el mismo recurso a dos facetas, evitando así las dudas, ¿es un documento que trata de manzanas o es un documento acerca de la compañía Apple_Computer?

La propuesta me parece sencilla, y una manera de contribuir a solucionar el problema inherente a las folksonomias, la ausencia de control termonológico: ambigüedades, polisemia, sinonimia. Tendremos que esperar qué opinan de ésto los usuarios.

… Pero todo ésto está mucho mejor explicado por Yusef en Facetas y Tagging

Post relacionados:

Ubicuidad en la red, con Baeza

El jueves asistí al último laboratorio de Cadius, que llevaba por título “Ubicuidad en la web”
y así como Roma tiene al Papa…pero Milan tiene a Armani, me vino a la mente una frase parecida España tiene a I. Aguillo, pero Chile tiene a Ricardo Baeza. Quizas sea una comparación demasiado simple pero son de los mayores especialistas en internet, webmetría y análisis de la red de redes que conozco y los he asociado.

La estructura del web y el ciclo de vida (nacimiento, movimiento, comunicación y desarrollo, muerte) de las páginas fue la introducción general de Baeaz a la ubicuidad, término en el que resumió los conceptos de buscabilidad (accesible para las máquinas) y visibilidad (accesible y usable para las personas). Me pareció muy interesante su mundo teórico y la descripción de la red, que se plasmaba en esa división entre lo humano y lo técnico y cómo ambas se influyen mutuamente.

Ahora que estamos en un mundo dominado por los SEO y la orientación al buscador y no a los usuarios, por mucho que digan, me llamó la atención lo que es el contrario, el analizar los resultados de los buscadores para redefinir los contenidos de una página. Supongo que será incultura, pero nunca había visto un uso real de minería de datos para ayudar a redefinir el contenido de un site. Baeza nos mostró un trabajo (Universia Chile) donde recogieron datos de las búsquedas, para añadir o especificar contenidos necesarios para los usuarios pero no definidos, y donde analizaron zonas relacionadas temáticamente para enlazarlas y así crear una estructura consistente en la estructura conceptual. El content (the king?) se ayuda de la técnica (the queen?)

Si me permitís una recomendación, para saber de que se habló leeros a Adolfo, que ha hecho un perfecto post del tema, al que he conocido en esta ocasión al igual que a ¿Gloria? y a Vanesa, de Fallinblog¡ un placer ;) Y como no¡ un saludo a la gente de cadiusy de BIE, q hacen el esfuerzo de organizar estos laboratorios

El éxito de los motores de búsqueda se debió en gran parte a la capacidad de indexar páginas de manera automática por los spiders, sin tener que invertir tiempo y dinero en la “evaluación por humanos” tal y como se venía haciendo con los recursos que se iban añadiendo en los directorios.

El salto cuantitativo fue enorme, pero con los problemas de trapicheos para mejorar el posicionamiento, la recuperación de la información relevante se vió mermada.

Y ahora Google parece que intenta solucionar el ruido documental y frenar los pies a las técnicas más agresivas para ganar posiciones, volviendo a los orígenes de la indización humana y según comenta Henk van Ess en Google’s evaluation laboratory Google está reclutando personas para revisar y evaluar la calidad de los recursos desde su propia casa.

“It’s a lab of humans from all over the world (from China to The Netherlands, from Korea to Brasil) They are paid to check search results of Google every day. Most of the employees, called international agents by Google, were recruited through universities all over the world. The aim is to avoid spam, to get the right sites at the top of the listing and to test new features, not shown to the public yet.”

Henk van Ess que parece que conoció el hecho de mano de unos de sus estudiantes (que tiene la suerte de ser uno de estos “humanos” reclutados por el buscador) lo denomina el Laboratorio Secreto de Evalúación de Google pero su nombre real es  ‘Rater Hub Google’, y promete comentar más detaqlles en los próximos días, por el momento nos deja un ejemplo de cómo trabajan  flash movie of the lab.

Parece que no es la primera vez que los buscadores echan mano de “evaluadores” y según comenta Nathan Weinberg en Google Running Secret Quality Labs?Yahoo ofrecía trabajo de “Surfers” para hacer lo mismo.

Las ofertas de empleo para Quality Rater están abiertas para españoles, holandeses, franceses e italianos, en Google ofrecen más información.

Si algún afortunado ha conseguido que acepten su solicitud que nos haga saber, a quien hay que sobornar para ser un Quality Rater.

Vía Google’s Evaluation Lab de Google Blogoscoped

Vía ResearchBuzz llego hasta la lista de algunos “papers” redactados por los trabajadores de Google desde 1985, que en algunos casos tratan temas relativos a los proyectos que están trabajando y encontramos artículos muy interesantes sobre tecnología y recuperación de información que nos acercan un poco a cómo funciona el buscador.

Me quedo con los dedicados a Search Engine Design/Information Retrieval/Web Information Retrieval, aunque algunos tengan ya unos cuantos añitos (1998…)

Google destaca en una de sus páginas los relativos a su tecnología, y por lo que he visto “ojeandolos” parece que son los más recientes.

Cada artículo cuenta con su propio resumen, y los podemos descargar en pdf.

Nuestro profe particular, Yusef Hassan, pone a nuestra disposición “Los Elementos de la Arquitectura de la Información-Recuperación de Información en la Web”:

un sencillo modelo que intenta explicar la relación e influencia mutua que tienen las principales variables que intervienen en la RI: Usuario, Interfaz, Sistemas de Interacción y Contenidos.

Un pdf para imprimir y no perder de vista.