Subscríbete a
Posts
Comentarios

IBM apuesta por la búsqueda basada en conceptos, en lugar de las tradicionales palabras clave, recuperar los datos en las redes corporativas.

El director de tecnologías de búsquedas de IBM Research, Arthur Ciccolo, resaltó la ausencia de investigación en este camino por parte de las grandes compañías de búsquedas en Internet, como Google, Yahoo y Microsoft se sigueen centradas en la Web pública, dejando a un lado la recuperación de información en la Intranets, y dado el volumen de datos que cada día generan, intercambian y almacenan las esmepresas, no debe ser, en absoluto, un tema para dejar en el olvido.

IBM, que recientemente presentó el proyecto de la nueva arquitectura de información de su Intranet, apostando por las folksonomías, pondrá a disposición del público Unstructured Information Management Architecture (UIMA), una tecnología que promete analizar textos, entre documentos y otros medios, para entender contenidos latentes, relaciones y hechos.

Estructura de Analisis de la información

Según informan en El Navegante, IBM ya está ofreciendo su ‘software’ WebSphere OmniFind, que ayuda a los usuarios a realizar búsquedas de datos sin estructura en una variedad de formatos o lenguajes, ser localizados en bases de datos, archivos de correo electrónico, grabaciones de sonido, imágenes o video.

Los resultados que finalmente vean la luz y de los que podremos aprovecharnos, son parte de un trabajo de más de 4 años de IBM Search en colaboración con la Agencia de Proyectos de Búsqueda Avanzados de la Defensa de Estados Unidos.

Por el momento ya podemos descargarnos un kit de prueba y conocer un poco más del proyecto en IBM’s alphaWorks Site.

Google Total

En Google Total podemos acceder 26 servicios de Google integrados en dos simples cajas de búsqueda. Un buen recurso para recudir tiempo.

Vía InsideGoogle

Cualidades imprescindibles

En una entrevista de Andalucía Investiga a la nueva directora técnica de la Biblioteca Nacional, Teresa Malo de Molina, volvemos a encontrarnos con la visión del profesional de la biblioteconomía como alguien más cercano al ratón de biblioteca que a gestionar información (se encuentre ésta en el soporte que sea):

En primer lugar un buen bibliotecario debe, ante todo, saber escuchar para conocer qué quiere o qué busca exactamente el usuario. Además, debe tener capacidad de análisis y de síntesis, así como una enorme disponibilidad para el público y por supuesto, debe sentir un gran amor por los libros, esta última cualidad es fundamental. No hay que olvidar que los bibliotecarios somos un colectivo muy vocacional y muchos de nosotros hemos sido autodidactas. Muchos somos filólogos o historiadores y, aunque en la actualidad se hace mucho énfasis a formación tecnológica y de gestión, yo considero que hay poca formación reglada con relación al tratamiento del patrimonio bibliográfico.

Pretender que el amor por libros sea una cualidad fundamental del “buen bibliotecario”, frente a otras tan importantes como la formación tecnológica… me da que pensar…

Blogflux es un nuevo directorio de blogs que presenta algunas novedades con respecto a los directorios a los que estamos acostumbrados, la principal es el uso de etiquetas para describir y buscar bitácoras.

Según informan sus creadores, Blogflux, nace tras comprar Eatonweb Portal, y ante la gran cantidad de información almacenada, quisieron mejorar y ofrecer unh mejor servicio.

Cada bitácora presenta informacion sobre el titulo y autor del blog, país, ciudad e idioma y una breve descripción, enriquecida además con un montón de categorías con las que está relacionada y unas tags que ayudan a la descripción.

Ficha de ejemplo

Incluye un apartado de enlaces relacionados que llevan a Google Adsense, y una sección de sindicación con varias opciones de lectores de  feeds y agregadores.

Permite buscar blogs por texto libre o si preferimos hojear los blogs podemos hacerlo por lengua, país, etiquetas

En la portada han incluído un listado de las 50 tags más populares y una sección para incluir nuestro blog.

Parece que los directorios están mudando su arquitectura… el tagging se impone, pues va a ser que al final la folksonomía no era ninguna tontería ;) .

Vía ResearchBuzz: Directory of Blogs by Tag or by Subject

La frase de la semana

Si los libros son consejeros sin ambiciones, amigos mudos, memoria del mundo, agenda del porvenir. Si son y han sido patria de un pueblo, brújula de almas perdidas, ventana de la imaginación, antídoto contra la estupidez, terreno de libertad, objetos para avivar el ingenio, buscar la justicia, la verdad y diversificar el ocio, ¿por qué leemos tan poco? [...]

Javier Aranda Luna en La cruz de la lectura

El Google Print, luces y sombras

Rafael Fernández publica en Baquía, Google Print y la Europa que no avanza, donde hace un repaso por la “historia” del Google Print y las reacciones y críticas que se han ido sucediendo desde que se anunció el proyecto por parte de Google en diciembre de 2004.

La fórmula no podría ser más brillante: sumar las ventajas de la digitalización de libros con la potencia del, para muchos, mejor motor de búsqueda de Internet. Un sueño hecho realidad, poder bucear en un mar de conocimiento sin salir de la pantalla y, quizás, no volver a escuchar la frase “lo siento señor, este libro está descatalogado”.

Fernández Tamames hace hincapié en las reacciones del sector europeo y la contrapartida de hacer frente a la supremacía americana con un Google Print a la europea asumido desde el ámbito estatal y destaca que Google es una empresa, no todo el Estado norteamericano:

[...] es poco realista, además de equivocado, pensar que los Estados tienen que asumir la tarea de digitalizar nuestro patrimonio cultural. Cierto sector de Europa no entiende la iniciativa privada, puesto que el proyecto de Google es el acuerdo entre una empresa e instituciones académicas, no una iniciativa estatal. Tampoco comprende que la actitud por la cual cuando exista una problema “el Estado debe resolverlo” es lo que provoca que en la actualidad no exista ninguna empresa en Europa del calibre de Google, Yahoo, Amazon o eBay. ¿Nadie entiende que Google es una empresa, y no es el Estado norteamericano? ¿Por qué se busca una confrontación EEUU-Europa cuando no la hay?

Y muy acertada la diferencia que plantea entre lo que quiere hacer Google y las bibliotecas a las que ha lelgado a un acuerdo y lo que existe en ela actualidad en España con la Biblioteca Virtual Miguel de Cervantes:

Es preocupante no entender el proyecto de Google Print intentando definirlo como una simple digitalización de documentos sin sentido. Google ha ideado un proyecto que tiene como base la tecnología, en concreto su tecnología de búsqueda, y la Biblioteca Miguel de Cervantes está centrada en aunar esfuerzos para difundir la cultura iberoamericana y construir herramientas para al ámbito académico. Se comparan proyectos que no tienen nada que ver.

Post relacionados:

Enrique Dans publica en su columna de Libertad Digital ”El efecto mariposa“ donde relaciona el famoso efecto del aleteo de una mariposa de Edward Lorenz con el ecosistema Internet:

[...] los aleteos de mariposa son, en muchas ocasiones, verdaderas mariposas que efectivamente aletean. Pero en otros casos, y curiosamente en muchos, ni existe mariposa, ni mucho menos aleteos. Son, simplemente, lo que en ciencia suele llamarse un “artefacto”, una creación ficticia propia de un error en los instrumentos de medida o de observación. De hecho, muy pocas de las variables que se utilizan para medir cosas en Internet hoy en día están exentas de errores. Y no hablamos de que se nos escapen pequeños aleteos de mariposa, sino de cosas mucho más graves. Hablamos de que se nos escapen tormentas del siete, simplemente porque en ese momento no estábamos mirando.

Genial la reflexión sobre sobre la validez de los rankings de popularidad, PageRank, etc en los que se basan los motores de búsqueda para ordenar los resultados de las consultas, favoreciendo o penalizando una determinada página bajo criterios que poco tienen que ver con la calidad de la información que ofrecen:

Criterios que todo el mundo aparentemente da por buenos, como el sacrosanto PageRank de Google, la cuenta de vínculos entrantes a una página web que lleva a cabo Technorati o los rankings de popularidad de Alexa son medidas completamente burdas, groseras, carentes de inteligencia, que responden únicamente al deseo de intentar reducir la incertidumbre, pero que lo hacen, en general, bastante mal.

Pero como Dans dice, mejor que nada son, y tendremos que esperar a que los motores de búsqueda perfilen sus algorítmos y veamos reducido el ruido y el silencio en nuestras búsquedas además de obtener una mejor ordenación de los resultados.

ACTUALIZACIÓN:

Comentan el tema aportando su punto de vista en Atalaya y El Telendro. Y Enrique Dans continua el tema en el post: Contestando a JJ.

Ésto se pone interesante, es uno de esos casos en los el buen uso del trackback ayudaría a seguir el hilo de la conversación.

Ian Barker, especialista en usabilidad y arquitectura de la información, ha publicado un artículo sobre cómo ayudar a la gente ha encontar lo que buscan en los sitios web y define el concepto de information scent* como:

Information scent is a term used to describe how people evaluate the options they have when they are looking for information on a site. When presented with a list of options users will choose the option that gives them the clearest indication (or strongest scent) that it will step them closer to the information they require.

Barker señala algunos indicios de cuando un sitio presenta una pobre information scent:

  • People can’t find the information they want on the site and use alternate methods of finding information, such as call centres, or other off-line resources.
  • People waste time finding information and feel negative towards the site.
  • People give up and leave the site from decision pages (i.e. the homepage or section pages) rather than content pages.

Y la máxima para crear sitios con una fuerte information scent es introducir contexto en nuestras secciones, ofrecer detalles de qué se puede encotnrar al cliquear aquí o allí, centrar al usuario. En su artículo ésto queda muy bien representado por estas dos ilustraciones:

  • Sin information scent:
  • Con information scent:

_________________

(*) No he encontrado una definición muy acertada de Information Scent (¿pistas de información?), así que se aceptan sugerencias de traducción.

Del.icio.us tag clusterer es un trabajo de Marc Zacher y Kai Bielenberg dos estudiantes de la Universidad de Bremen en Alemania. El proyecto forma parte la Tesis que están desarrollando “Groups in Social Software: Utilizing Tagging to Integrate Individual Contexts for Social Navigation” y para que han abierto un blog.

La aplicación de estos dos estudiantes ordena nuestras etiquetas del Del.icio.us en clusters, agrupaciones de objetos que comparten alguna similitud:

A byproduct of our work is the del.icio.us tag clusterer. This little tool clusters your del.icio.us resources on the basis of your related tags. You have to provide your del.icio.us username and password to use this service.

Para ver como nuestras etiquetas pasan a formar “racimos” tan solo tenemos que validar nuestro nombre de usuario del Delicious y contraseña y podemos empezar a elegir cuántos grupos queremos formar:

Mi Delicious por Clusters

Y ya podemos empezar a bucear dentro de cada “racimo” por las tags. En mi caso he seleccionado un grado de granularidad de 6 y los resultados son bastante coherentes teniendo en cuenta que se realiza de manera automática:

  • Cluster de Ai, usabilidad, accesibilidad:
Cluster AI
  • Cluster de Folksonomías:
Cluster folksonomas
  • Cluster de Web Semántica:
Cluster Web Semántica
  • Cluster de Recuperación de Información:
Cluster SRI
  • Cluster de Información de Referencia, utilidades:
Cluster Información de Referencia
  • Cluster de Biblioteconomía:
Cluster Biblioteconoma

Los autores perfilan en un post en qué se han basado para el desarrollo:

The clustering performs a k-means clustering algorithm. We use the Orange library with clustering extensions for this.

Hay más información sobre el tema en una lista de discusión sobre Del.icio.us y un interesante post sobre las nubes de etiquetas y el clustering de Fernando Blat.

Post relacionados:

Flickr ya realiza clustering

Flickr se renueva y ya realiza clustering, ahora ya  encontramos los resultados de nuestras búsquedas, ordenados en clusters:

Flickr incorpora el clustering

En el ejemplo, “librarians” nos devuelve las imágenes categorizadas en:

Vía El Telendro: Novedades en Flickr

Estos días se está celebrando en mi ciudad la 34 edición de la Feria del Libro, las casetas estarán instaladas en los Jardines de Mendez Nuñéz hasta el 10 de Agosto., en un horario de 11 a 14 y de 18 a 22 horas.

La feria del libro en los jardnes de Méndez Nuñéz, esto del Google Earth..

Organizada por la Federación de Libreiros de Galicia, este año cuenta con 53 expositores, entre los cuales podemos acercanos a ver las novedades de las principales editoriales gallegas, que forman parte de la Asociación Galega de Editores:

Hércules de Ediciones, Kalandraka Editora, Nova Galicia Edicións, Editorial Galaxia, Novos Vieiros-Gran Enciclopedia Galega, Editorial Tambre-Grupo editorial Luís Vives, Edicións Xerais de Galicia, Xuntanza Editorial e a distribuidora Consorcio Editorial Galego ( A Nosa Terra, Baía Edicións y Sotelo Blanco.

Para aquellos que podemos acercanos, han programado una seria de actividades, presentaciones, firmas de libros, cuentacuentos… que giran en torno al libro galego.

Entre los autores que se acercarán a firmar sus libros destacan Xosé Neira Vilas, Suso de Toro, Rosa Aneiros, Manuel Rivas, Xaime Quessada, Xosé Manuel Beiras, Miguel Anxo Fernán Vello, Tim Bowley, Anxos Sumai, Miguel A. Mato Fondo y Xurxo Souto.

El programa detallado de cada día podemos descargarlo en la Web de la AGE.

No he conseguido conocer cúal es el cartel oficial de este año, así que mientras os dejo con el poster que ilustraba la edición del año pasado:

feria del libro

Post relacionados:

Talk Digger, hablan de ti

Talk Digger te permite conocer quienes hablan y enlazan a tu blog:

Quien te enlaza, quien habla de ti