Algoritmos de Relevancia
Ayer publiqué un pequeño post diciendo que la relevancia sólo puede determinarla la mente humana. Hoy me alargaré un poco más en el asunto indicando dónde se esconde la inteligencia humana detrás de los distintos algoritmos.
PageRank: Es el algoritmo más conocido, por ser el usado por Google. Hay que decir que Google tiene inteligencia cero. Si al usarlo nos parece que tiene inteligencia, es porque la ha extraido de los webmasters que publican páginas webs. Es decir, es un agregador de la inteligencia colectiva de todos los webmasters, obteniendo esa inteligencia colectiva principalmente de los textos de los enlaces. Google no entiende nada de los significados de lo que buscamos, ni de los significados de las páginas encontradas, símplemente hace comparaciones entre palabras.
TrustRank. Este algoritmo está indicado sobre todo en combatir el spam en buscadores. Parte de la idea que el buscador debe dar más credibilidad a sítios conocidos y confiables, y menos cuanto más nos alejemos de ellos. Es el viejo concepto de “dime con quien andas ..”. Ni que decir tiene que esos sitios iniciales han de introducirse a mano.
Hilltop. Este algoritmo parte de la idea que hay sitios web importantes, autoridades, expertos en una materia en concreto. Los enlaces de esos sitios tienen más valor. De nuevo la inteligencia humana detrás de los creadores de esos sitios web.
La relevancia puede además tener multiples aspectos, por ejemplo:
Ordenación por número de clicks. Los elementos con más ratios de clicks se situan al comienzo. Es la manera de ordenar los anuncios en Adwords por ejemplo. Muchas webs ordenan sus listas de enlaces en base al número de clicks. De nuevo la inteligencia humana está en los autores de esos clicks.
Ordenación por ratio de ventas. Es la manera natural de ordenar los productos en una tienda. Los productos más comprados se situan al comienzo. La inteligencia evidentemente la proporcionan los compradores.
Ordenación por Votos. Es la mejor manera de ordenar. Es una manera tan importante y tan efectiva de ordenar, que la usamos para otorgar premios (Oscar, Goya, concursos), y para elegir a quien nos gobierna.
Hay que decir que también hay otros factores de relevancia:
Ordenación por Fecha. Es la manera natural de ordenar las noticias en un periódico y los artículos en un blog. Cuando alguien busca novedades, es evidente que la fecha de publicación importa.
Y por último, el peor (creo yo) factor de ordenación:
Ordenación Alfabética. Es una manera pésima de ordenar. Horrible. ¿Alguien se imagina un buscador devolviendo resultados en orden alfabético?. En esta manera de ordenar se ha eliminado completamente la inteligencia humana. La ordenación alfabética realmente es un sistema de clasificacion, es decir, su único sentido es hacer fácil el encontrar un elemento en concreto cuando ya se conoce su nombre. Es últil para libros y páginas amarillas en papel, pero no para internet. Los libros no tienen cajitas de búsqueda, los ordenadores sí.
Comments(2)