Archive for Febrero, 2007

La inteligencia artificial es una muñeca hinchable

La inteligencia artificial es a la verdadera inteligencia lo que una muñeca hinchable es a una mujer de verdad. Vamos, que ni punto de comparación.

Querer equiparar la inteligencia humana a la artificial es absurdo. Queda muy bonito en películas y series de ciencia ficción pero no tiene nada de real, y eso lo digo sabiendo de lo que hablo. He trabajado mucho tiempo en mi programa de ajedrez, me he leido casi todo lo que está escrito sobre algoritmos de inteligencia artificial, he trabajado varios años haciendo la inteligencia artificial de videojuegos, y a lo que más se parece es a un decorado de cartón piedra de las películas del oeste. De lejos puede aparentar real, pero es todo más falso que un billete de 300 Euros.

Si los programas de ajedrez son capaces de ganar a los campeones del mundo humanos, es porque el ajedrez tiene una componente de cálculo muy importante. A nadie se le ocurriría competir con su calculadora por ver quien hace las operaciones matemáticas más rápidas, y eso es lo que sucede con el ajedrez.

Sin embargo, cosas tan aparentemente sencillas para nosotros como reconocer una imagen, una voz, entender un texto escrito son problemas durísimos para un ordenador. Los ordenadores calculan mucho, pero no entienden nada, por eso precisamente nos resultan tan útiles, porque nosotros entendemos y reconocemos muy bien, pero calculamos muy poco y mal, además de nuestros problemas de memoria.

La inteligencia artificial nunca superará la humana. Si eso sucediera, ¿podría esa inteligencia superior programar otra inteligencia superior? ¿Y esa superior otra superior a su vez, así hasta el infinito? Ojalá suceda, pero no lo verán mis ojos. Todo esto queda muy bien para fantasear y hacer películas. Crear una inteligencia superior a la humana es una utopía que tiene muy poco de real.

Todo eso no quita que se pueda avanzar por ahí, y de hecho, hay aplicaciones y programas de reconocimiento de imágenes, de tratamiento del lenguaje natural, de reconocimiento de voz, que funcionan extraordinariamente bien, sorprendentemente bien. Pero eso son aplicaciones prácticas muy concretas, que están muy lejos de tener una verdadera consciencia artificial, consciente de sí misma y de su propia existencia, con la que se pueda dialogar como se dialoga con un ser humano, que posean creatividad, que generen ideas o conceptos, o que entiendan ideales como justicia y belleza.

Animando a los usuarios a participar

Por casualidad, llego a esta página del maestro de la usabilidad Jakob Nielsen donde habla de la desigualdad de la partipación de los usuarios en internet.

Summary:
In most online communities, 90% of users are lurkers who never contribute, 9% of users contribute a little, and 1% of users account for almost all the action.

En resumen viene a decir que el 90% de los usuarios son mirones que nunca contribuyen, el 9% contribuye algo, y el restante 1% son los responsables de práticamente toda las contribuciones.

Dice que la participación sigue una ley de potencias, con una gráfica que se vuelve lineal con una escala logarítmica. No puedo estar más de acuerdo.

Al final da unos consejos de cómo fomentar la participación de los usuarios:

  • Haz que sea fácil que participen.
  • Haz que la participación sea una consecuencia de la propia actividad.
  • Editar, no crear.
  • Recompensar (pero no demasiado) la participación.
  • Promociona a los colaboradores destacados.

Muy curioso también lo que dice sobre los buscadores:

Search. Search engine results pages (SERP) are mainly sorted based on how many other sites link to each destination. When 0.1% of users do most of the linking, we risk having search relevance get ever more out of whack with what’s useful for the remaining 99.9% of users. Search engines need to rely more on behavioral data gathered across samples that better represent users

Los resultados de los buscadores (SERP) se ordenan principalmente en función de cuantos otros sitios web enlazan a cada resultado. Cuando sólo el 0.1% de los usuarios crean la mayoría de los enlaces, nos arriesgamos a tener resultados inservibles para el restante 99.9% de los usuarios. Los buscadores necesitan basarse en muestras de datos que representen mejor el comportamiento los usuarios.

La comunidad como control del spam

En un post anterior hablaba del filtro antispam CloudMark, hoy voy a explicar un poco más en qué consiste y cuál es la idea que hay detrás.

El filto funciona de la siguiente manera: cuando recibimos un correo en nuestro email, nuestro cliente de correo envía una petición a un servidor y le pregunta si ese mensaje es spam. Si muchos usuarios ya han indicado que es spam, automáticamente lo clasifica como tal y lo borra o lo mueve a la carpeta de spam. También tenemos unos botoncitos en nuestro cliente de correo para poder indicar nosotros mismo si un correo es spam o no lo es. El concepto es muy similar a dar votos positivos y negativos.

Barrita de herramientas en outlook

El sistema funciona realmente bien, mucho mejor que otros tipos de filtros antispam, como popfile, k9, etc, que además necesitan un periodo de entrenamiento.

El sistema tiene un único punto débil, y es el método de generación de la clave hash que identifica un correo. Los spammers no siempre mandan exactamente el mismo correo a todo el mundo, sino que introducen algún tipo de “personalización” con el objeto de que cada correo tenga un código hash distinto. Contra esto se ha desarrollado un generador de códigos hash “fuzzy” resistente a pequeños cambios en el correo, aunque periódicamente hay que cambiar el algoritmo.

Referencias:

¿Qué usas para trabajar?

Emilio Márquez me manda el meme, ¿qué usas para trabajar?. Respondo:

Tres programas verdaderamente útiles

Voy a poner 3 programitas que uso mucho cuando trabajo con Windows (también tengo otro pc con una distro de Debian) y que para mi son fundamentales para trabajar bien.

Folder Size for Window (Freeware)

Es un pequeño programita que al instalarlo, te permite ver lo que ocupa cada carpeta en el explorador de Windows. Extremadamente útil cuando quieres hacer limpieza en el disco duro porque te estás quedando sin espacio, o cuando vas a hacer backups.

Actual Window Menu (Free Trial: 60 días)

Este pequeño programita te permite mantener cualquier venta encima de otra. Por ejemplo, estás con una ventana del messenger abierta y quieres seguir navegando por internet. Con este programa, puedes poner la ventanita del msn por encima de las demás, con lo que siempre será visible, y seguir trabajando o haciendo lo que quieras. También permite redimensionar cualquier ventana, hacerla transparente y más cosas.

CloudMark (Free Trial: 15 días)

Es el mejor programa antispam que conozco, y dudo mucho que haya ninguno mejor. Sobre este programa crearé un post independiente, pero vaya por delante que recibo unos 900 correos de spam diarios y me los para practicamente todos (menos 2 o 3 al día) sin ningún falso positivo. Totalmente espectacular. Después de probar popfile, k9, spamassasin, etc, etc.. nada.. Cloudmark es el mejor con mucha diferencia.

El sucesor de Google: ¿Myspace?

Hoy quiero poner un post que seguramente le sorprenda a mucha gente. Creo que un posible candidato a rey de las búsquedas podría ser Myspace, la red social por excelencia.

Si mi idea de que los humanos son mejores que las máquinas en determinar la relevancia de los resultados de las búsquedas es correcta, un sitio que cuenta con más de 100 millones de usuarios registrados, creciendo a un ritmo de 230.000 nuevos usuarios al día puede ser un buen candidato.

Según esta noticia, un cerebro humano tendría 4.800 Gigaflops de capacidad de cálculo, o unos 5 Teraflops. Según este otro enlace tendría 10 Petaflops. Dejémoslo en 1 Petaflop.

Si una mínima parte de los usuarios de Myspace, pongamos 1 millón de usuarios se pusieran a mejorar su buscador, eso nos daría un equivalente a 1 Zettaflop por segundo de capacidad de cálculo. Dudo mucho que Google con sus granjas con más de 450.000 servidores puedan superar nunca esa capacidad de cálculo, y eso sin entrar en el asunto desentrañar el software que corre dentro de un cerebro humano.

Otro posible candidado sería la Wikipedia, pero como ya de hecho están en ello no hace falta que los nombre. Aquí una gráfica comparando el crecimiento de la Wikipedia con Myspace:

wikipedia-myspace.png

Los errores que cometí con Kratia

Kratia ya lleva un año de vida, y no ha despegado en su uso, sin embargo, la idea de hacer un buscador basado en la gente y no en algoritmos parece que ha calado hondo y están surgiendo numerosas iniciativas basadas en este concepto. Dos ejemplos son ChaChá, y Search Wikia.

ChaChá es un buscador con asistente humano, es decir, podemos hacer una búsqueda normal, y si lo requerimos, podemos pedir la ayuda de un asistente humano que hará las búsquedas por nosotros y nos ofrecerá los mejores resultados. El asistente humano se supone que utilizará algún otro buscador como Google, revisará los resultados, y sólo nos ofrecerá los que considere los mejores. El asistente humano nos determinará lo que es relevante y lo que no.

Search Wikia es el buscador que tiene en proyecto el fundador de la wikipedia. Muy interesante su entrevista en Information Week donde habla de las bases de su proyecto, y por qué cree que tendrá éxito donde Google falla. Muy interesante su lectura porque corrige los errores que cometí.

Bueno, volviendo al principio, los errores que creo que cometí son:

  • No pedir registro de usuarios. Este error es demasiado evidente, sabía que debía hacerlo. No lo hice por querer sacar el buscador demasiado rápido, y luego no lo añadí porque quería contar con el apoyo de inversores/socios para implementar todas las ideas que tenía en la cabeza y no desvelarlas todas en un principio. Me precipité en sacarlo, y luego he perdido demasiado tiempo en corregir los fallos.
  • Buscar inversores. Durante bastante tiempo he estado buscando inversores contándoles la idea del proyecto para ver si se animaban. Igual no lo he hecho bien, pero el caso es que no ha salido nada. Creo que debí haberme concentrado más en desarrollar en buscador y olvidarme de los inversores. Los inversores de capital riesgo no quieren riesgos, sólo van a lo seguro. Si el proyecto tiene éxito, ya vendrán.
  • No abrir un blog y un foro. Creo que debía haber abierto un blog y un foro en Kratia desde el comienzo, contar el con el feedback, el apoyo de los usuarios y crear comunidad es fundamental.
  • Pedir permiso a los “grandes” para usar sus resultados. Creo que este fué otro error. Si ya ofrecen la API, podía haberla usado y listo, si no les gusta lo que hago ya cortarán el grifo.
  • No hacerlo Open Source. Han habido numerosas personas que se han ofrecido a colaborar con el proyecto, rediseñando la web, mejorando el código, ofreciendo hacer traducciones, etc. Ha sido un error por mi parte no pensar en esta posibilidad desde el principio y tratar de hacerlo todo yo sólo. Cuanto más abierto el proyecto a la colaboración, mejor.
  • Falta de transparencia. Ese puede ser el resumen de todos los errores, falta de transparencia. Cuando un usuario vota un resultado, debería ser visible para todos los demás usuarios quién ha dado ese voto. Cada usuario debería tener su página de perfil donde poder consultar cuál ha sido su actividad, los comentarios que ha hecho, los votos que ha dado, etc. Además, de ofrecer más comunicación por mi parte en un blog, un foro, y liberar el código.
  • No mandar notas de prensa. Este fué otro de los errores. Al lanzar el buscador debía haber lanzado una campaña de notas de prensa para que los medios de comunicación se hicieran eco del proyecto.

De errores se aprende, espero no seguir cometiendolos a partir de ahora.

Hay que decir también que tengo en mente dos ideas que aún no he sacado a la luz y son bastante innovadoras:

  • Un sistema de publicidad contextual sin posibilidad de fraudes (por click o cualquier otro tipo).
  • Búsquedas realmente personalizadas. El buscador aprende de los gustos y preferencias y ofrece los resultados más relevantes a cada usuario.

Videos del 73ª Edición de Thursday Internet : Los Buscadores como puerta de acceso a la sociedad de la información

El pasado 25 de Enero tuvo lugar la 73 edición del Thursday Internet, organizado por Ildefonso Mayorgas, Rubén García, y Emilio Marquez. Esta vez tenía como título “Los buscadores como puerta de acceso a la sociedad de la información”. Estuvieron allí presentes gran cantidad de profesionales del sector y medios de comunicación. Estaban allí de ponentes Bernardo Hernández de Google, Diego Díaz de Yahoo!, Ismael El-qudsi de Live (Microsoft), Samuel Arenas de Ask y Antonio Valderrábanos de Bitext.

Fué bastante interesante, aunque no contaron mucho sobre las cosas que tienen reservadas para el futuro. Tuve la oportunidad de hablar un poco sobre Kratia, aquí os pongo dos videos:

Del evento se hicieron eco numerosos blogs: