La estupidez semántica

Llevaba algún tiempo queriendo publicar algo sobre la web semántica, hasta ahora no lo había hecho más que nada porque Angel María cree en ella, pero bueno, ahí va…

Esto de la web semántica se me antoja un sinsentido sin pies ni cabeza. Sería una estupidez más de las muchas que circulan por internet, si no fuera porque detrás de la iniciativa están ni más ni menos que el W3 Consortium y uno de los “padres” de internet, Tim Berners-Lee.

La idea de fondo es dotar a la web de “significado”, para que lo que publiquemos en internet sea más fácilmente entendible por los programas de inteligencia artificial de los buscadores. Es decir, dada la incompetencia e inhabilidad de los buscadores para entender lo que buscamos, se trata de que TODOS los webmasters y creadores de contenidos para la web añadan más información (metadatos) explicando el significado de lo que publican.

Ni qué decir tiene que es un fracaso cantado. Dados los escasos y ridículos frutos que han dado las numerosas iniciativas de crear una verdadera inteligencia artificial, la web semántica no es más que una chapuza para intentar ponerle las cosas más fáciles a los ordenadores. Es una iniciativa destinada al fracaso, no sólo por la imposibilidad de crear una verdadera inteligencia artificial, sino también por los enormes problemas que provocaría en uniformar los estándares, en definir la granularidad de los metadatos (es decir, hasta que profundidad llegamos explicando el significado de lo que publicamos), en contrarestar las técnicas SEO abusivas, la torpeza de los creadores de contenidos, etc, etc

Ahí afuera hay mucha gente que se cree que los ordenadores tienen más inteligencia de la que realmente tienen. La inteligencia artificial no es más que estupidez artificial, y NUNCA se podrá comparar a una inteligencia humana (por lo menos con la tecnología actual). Si no somos capaces de crear un ordenador que supere en inteligencia a un mosquito, ¿cómo nos atrevemos a pensar que se puede superar a un ser humano?

Usar Google es de idiotas

Una cosa que he conocido hace poco es la etimología de la palabra idiota:

IDIOTA

La palabra idiota proviene del griego ιδιωτης [leer: idiotes] para referirse aquel que no se ocupaba de los asuntos públicos, sino sólo de sus intereses privados. La raíz “idio” significa “propio” y es la misma que en “idioma” o en “idiosincrasia”.

Idiotas era como se designaba en la democracia ateniense a los ciudadanos que no se preocupaban de los asuntos públicos, los que no participaban en la vida política de la ciudad.

Google nos hace idiotas. Ellos nos dictan qué información vemos y qué no vemos. Ellos censuran.

¿Es eso lo que queremos para el futuro? ¿Una empresa con ánimo de lucro, que cotiza en bolsa, y que tiene que rendir cuentas a sus accionistas de los beneficios anuales, la que decida por nosotros lo que vemos y lo que no vemos? Si eso es el futuro, permitirme que os diga que es un futuro que apesta.

Actualización:  Como varias personas se han quejado, aclaro que con este post no prentendo ofender a nadie, sino más bien dar un punto de vista de una manera llamativa y quizá un tanto demagógica y visceral. Que nadie se sienta ofendido, es sólo una manera de llamar la atención.

The crazy ones

Os pongo un vídeo que me ha emocionado:

Visto en el blog de Jorge Villabona

Monitorizando un servidor con Ajax

Un problema a los nos dedicamos a esto del desarrollo web, es estar monitorizando el servidor, la carga, los errores, los ficheros log, etc. Normalmente eso lo hago con una sesión ssh, desde una shell de linux, pero ya estaba cansado de estar logueandome, así que pensé que sería interesante hacer eso mismo desde un script php que se recargue con ajax, así que lo he hecho. El script es totalmente configurable y está protegido por contraseña, sin necesidad de crear un .htaccess.

Podéis ver una demo en la dirección:

http://www.mariocarbonell.com/server/server.php
Usuario: server
Contraseña: info

Tanto la contraseña para entrar al script, como los comandos que se ejecutan en el servidor son configurables en el fichero server_config.php. Espero que os guste, se admiten comentarios.

Descargar el script: ajax-server-info.zip (15€)

El precio del script es 15€, a través de la pasarela de pago segura de Click&Buy.

La inteligencia artificial es una muñeca hinchable

La inteligencia artificial es a la verdadera inteligencia lo que una muñeca hinchable es a una mujer de verdad. Vamos, que ni punto de comparación.

Querer equiparar la inteligencia humana a la artificial es absurdo. Queda muy bonito en películas y series de ciencia ficción pero no tiene nada de real, y eso lo digo sabiendo de lo que hablo. He trabajado mucho tiempo en mi programa de ajedrez, me he leido casi todo lo que está escrito sobre algoritmos de inteligencia artificial, he trabajado varios años haciendo la inteligencia artificial de videojuegos, y a lo que más se parece es a un decorado de cartón piedra de las películas del oeste. De lejos puede aparentar real, pero es todo más falso que un billete de 300 Euros.

Si los programas de ajedrez son capaces de ganar a los campeones del mundo humanos, es porque el ajedrez tiene una componente de cálculo muy importante. A nadie se le ocurriría competir con su calculadora por ver quien hace las operaciones matemáticas más rápidas, y eso es lo que sucede con el ajedrez.

Sin embargo, cosas tan aparentemente sencillas para nosotros como reconocer una imagen, una voz, entender un texto escrito son problemas durísimos para un ordenador. Los ordenadores calculan mucho, pero no entienden nada, por eso precisamente nos resultan tan útiles, porque nosotros entendemos y reconocemos muy bien, pero calculamos muy poco y mal, además de nuestros problemas de memoria.

La inteligencia artificial nunca superará la humana. Si eso sucediera, ¿podría esa inteligencia superior programar otra inteligencia superior? ¿Y esa superior otra superior a su vez, así hasta el infinito? Ojalá suceda, pero no lo verán mis ojos. Todo esto queda muy bien para fantasear y hacer películas. Crear una inteligencia superior a la humana es una utopía que tiene muy poco de real.

Todo eso no quita que se pueda avanzar por ahí, y de hecho, hay aplicaciones y programas de reconocimiento de imágenes, de tratamiento del lenguaje natural, de reconocimiento de voz, que funcionan extraordinariamente bien, sorprendentemente bien. Pero eso son aplicaciones prácticas muy concretas, que están muy lejos de tener una verdadera consciencia artificial, consciente de sí misma y de su propia existencia, con la que se pueda dialogar como se dialoga con un ser humano, que posean creatividad, que generen ideas o conceptos, o que entiendan ideales como justicia y belleza.

Animando a los usuarios a participar

Por casualidad, llego a esta página del maestro de la usabilidad Jakob Nielsen donde habla de la desigualdad de la partipación de los usuarios en internet.

Summary:
In most online communities, 90% of users are lurkers who never contribute, 9% of users contribute a little, and 1% of users account for almost all the action.

En resumen viene a decir que el 90% de los usuarios son mirones que nunca contribuyen, el 9% contribuye algo, y el restante 1% son los responsables de práticamente toda las contribuciones.

Dice que la participación sigue una ley de potencias, con una gráfica que se vuelve lineal con una escala logarítmica. No puedo estar más de acuerdo.

Al final da unos consejos de cómo fomentar la participación de los usuarios:

  • Haz que sea fácil que participen.
  • Haz que la participación sea una consecuencia de la propia actividad.
  • Editar, no crear.
  • Recompensar (pero no demasiado) la participación.
  • Promociona a los colaboradores destacados.

Muy curioso también lo que dice sobre los buscadores:

Search. Search engine results pages (SERP) are mainly sorted based on how many other sites link to each destination. When 0.1% of users do most of the linking, we risk having search relevance get ever more out of whack with what’s useful for the remaining 99.9% of users. Search engines need to rely more on behavioral data gathered across samples that better represent users

Los resultados de los buscadores (SERP) se ordenan principalmente en función de cuantos otros sitios web enlazan a cada resultado. Cuando sólo el 0.1% de los usuarios crean la mayoría de los enlaces, nos arriesgamos a tener resultados inservibles para el restante 99.9% de los usuarios. Los buscadores necesitan basarse en muestras de datos que representen mejor el comportamiento los usuarios.

La comunidad como control del spam

En un post anterior hablaba del filtro antispam CloudMark, hoy voy a explicar un poco más en qué consiste y cuál es la idea que hay detrás.

El filto funciona de la siguiente manera: cuando recibimos un correo en nuestro email, nuestro cliente de correo envía una petición a un servidor y le pregunta si ese mensaje es spam. Si muchos usuarios ya han indicado que es spam, automáticamente lo clasifica como tal y lo borra o lo mueve a la carpeta de spam. También tenemos unos botoncitos en nuestro cliente de correo para poder indicar nosotros mismo si un correo es spam o no lo es. El concepto es muy similar a dar votos positivos y negativos.

Barrita de herramientas en outlook

El sistema funciona realmente bien, mucho mejor que otros tipos de filtros antispam, como popfile, k9, etc, que además necesitan un periodo de entrenamiento.

El sistema tiene un único punto débil, y es el método de generación de la clave hash que identifica un correo. Los spammers no siempre mandan exactamente el mismo correo a todo el mundo, sino que introducen algún tipo de “personalización” con el objeto de que cada correo tenga un código hash distinto. Contra esto se ha desarrollado un generador de códigos hash “fuzzy” resistente a pequeños cambios en el correo, aunque periódicamente hay que cambiar el algoritmo.

Referencias:

¿Qué usas para trabajar?

Emilio Márquez me manda el meme, ¿qué usas para trabajar?. Respondo:

Tres programas verdaderamente útiles

Voy a poner 3 programitas que uso mucho cuando trabajo con Windows (también tengo otro pc con una distro de Debian) y que para mi son fundamentales para trabajar bien.

Folder Size for Window (Freeware)

Es un pequeño programita que al instalarlo, te permite ver lo que ocupa cada carpeta en el explorador de Windows. Extremadamente útil cuando quieres hacer limpieza en el disco duro porque te estás quedando sin espacio, o cuando vas a hacer backups.

Actual Window Menu (Free Trial: 60 días)

Este pequeño programita te permite mantener cualquier venta encima de otra. Por ejemplo, estás con una ventana del messenger abierta y quieres seguir navegando por internet. Con este programa, puedes poner la ventanita del msn por encima de las demás, con lo que siempre será visible, y seguir trabajando o haciendo lo que quieras. También permite redimensionar cualquier ventana, hacerla transparente y más cosas.

CloudMark (Free Trial: 15 días)

Es el mejor programa antispam que conozco, y dudo mucho que haya ninguno mejor. Sobre este programa crearé un post independiente, pero vaya por delante que recibo unos 900 correos de spam diarios y me los para practicamente todos (menos 2 o 3 al día) sin ningún falso positivo. Totalmente espectacular. Después de probar popfile, k9, spamassasin, etc, etc.. nada.. Cloudmark es el mejor con mucha diferencia.

El sucesor de Google: ¿Myspace?

Hoy quiero poner un post que seguramente le sorprenda a mucha gente. Creo que un posible candidato a rey de las búsquedas podría ser Myspace, la red social por excelencia.

Si mi idea de que los humanos son mejores que las máquinas en determinar la relevancia de los resultados de las búsquedas es correcta, un sitio que cuenta con más de 100 millones de usuarios registrados, creciendo a un ritmo de 230.000 nuevos usuarios al día puede ser un buen candidato.

Según esta noticia, un cerebro humano tendría 4.800 Gigaflops de capacidad de cálculo, o unos 5 Teraflops. Según este otro enlace tendría 10 Petaflops. Dejémoslo en 1 Petaflop.

Si una mínima parte de los usuarios de Myspace, pongamos 1 millón de usuarios se pusieran a mejorar su buscador, eso nos daría un equivalente a 1 Zettaflop por segundo de capacidad de cálculo. Dudo mucho que Google con sus granjas con más de 450.000 servidores puedan superar nunca esa capacidad de cálculo, y eso sin entrar en el asunto desentrañar el software que corre dentro de un cerebro humano.

Otro posible candidado sería la Wikipedia, pero como ya de hecho están en ello no hace falta que los nombre. Aquí una gráfica comparando el crecimiento de la Wikipedia con Myspace:

wikipedia-myspace.png

« Entradas anterioresEntradas siguientes »