MENACE, el juego de inteligencia artificial que aprende a ganar al 3 en raya

Empecemos por el principio, ¿Qué es la inteligencia artificial? ¿Cuál es el proceso que sigue una persona para aprender a jugar a cualquier juego? Tomaremos de ejemplo en este caso un juego muy sencillo como es el 3 en raya. Ya sabemos que el 3 en raya es un juego de estrategia ganadora, en el que si ambos jugadores juegan de forma perfecta, el juego acabará en empate.

¿Qué proceso seguiría una persona para aprender a jugar bien, hasta llegar a hacerlo de forma perfecta, al 3 en raya? En un primer momento la persona únicamente conocería la mecánica del juego: por turnos, cada jugador va poniendo una ficha en cualquiera de las 9 casillas del tablero. El que logre 3 en línea, gana.

Una vez conocidas las reglas del juego, una persona comenzaría a jugar, aprendiendo de los errores a medida que se van sucediendo las partidas y realizando con mayor frecuencia las jugadas más apropiadas en cada momento, hasta llegar a aprender a jugar de forma perfecta. Este será el punto de partido del juego MENACE, que ahora veremos.

Supongamos que ahora queremos que un ordenador juegue de forma perfecta al 3 en raya. A diferencia de las personas, los ordenadores no tienen inteligencia. Por tanto, únicamente podríamos programar el ordenador para que realizara los movimientos que sabemos son los que hay que seguir.

El ordenador no ha aprendido a jugar, simplemente realiza los movimientos correctos porque le hemos indicado exactamente qué debe hacer en cada momento, ya que, a diferencia de las personas, los ordenadores no tienen inteligencia. Por tanto, si programáramos un ordenador únicamente para que conociera las reglas de juego y jugara al 3 en raya, ¿cómo podríamos lograr que este ordenador lograra aprender (artificialmente, ya que realmente continuaría realizando las instrucciones que le habríamos indicado) a jugar al 3 en raya de forma perfecta a medida que va jugando cada vez más y más partidas?

Esta es la particular característica del juego, motor, máquina (o como lo queramos llamar) MENACE  (Matchbox Educable Noughts And Crosses Engine), traducido como “Juego de caja de cerrillas educable para el 3 en raya”. Es un juego , o también podríamos decir que es una máquina (en el sentido de que realizará una serie de acciones) diseñada para  jugar al 3 en raya. En un primer momento jugará de forma aleatoria, y a medida que se suceden las partidas, será capaz de aprender a jugar de forma perfecta siguiendo un proceso similar al que haría una persona, es decir, adquiriendo una cierta inteligencia (artificial).

Este juego, o máquina, está formada por 304 cajas de cerillas, cada una de ellas con cada posible posición en la que pueden encontrarse las fichas en el 3 en raya (en realidad hay 19683 posiciones, pero eliminando rotaciones y simetrías, quedan simplemente 304).

Cada una de las 304 cajas contiene en su interior un número de canicas (o similares) iguales al número de posiciones posibles libres que hay para continuar el juego. Cada canica tiene un color asociado a cada posición del tablero. Por ejemplo, el código de colores podría ser el siguiente:

El juego se desarrollaría de la siguiente manera:

Suponemos que siempre empezará nuestro juego MENACE. La caja de cerillas con la que se empezará el juego será la que tenga el tablero vacío. Como hay 9 posibles posiciones dónde colocar una ficha, la caja tendrá las 9 canicas de los diferentes colores en su interior. Se agitará y se sacará una canica al azar. El color obtenido equivaldrá a colocar una ficha en dicha posición, siguiendo el código de colores fijado.

Por ejemplo:

Fuente: ‘Building a MENACE machine’, Matthew Scroggs

A continuación la persona contra la que juega, que seremos nosotros, colocaremos nuestra ficha. La colocaremos en el centro.  Ahora buscaremos la caja con la posición de las fichas que hay y sacaremos aleatoriamente una nueva canica. Ha salido la azul, por tanto colocamos la ficha correspondiente al color azul:

Fuente: ‘Building a MENACE machine’, Matthew Scroggs

Y el proceso se desarrollará de igual manera. La persona contra la que se está jugando (nosotros) colocaremos de nuevo nuestra ficha. Colocaremos nuestra X debajo de la ficha central. A continuación, habrá que buscar otra vez la caja con la posición de las fichas que hay en el tablero, y sacando una canica al azar obtendremos la nueva posición de la ficha de nuestra máquina o juego MENACE. El color obtenido ahora ha sido el verde, por tanto colocaremos la ficha correspondiente. Vemos que casualmente (ya que las fichas por parte de la máquina se colocan de forma aleatoria) es la jugada que nos impide completar el 3 en raya.

Fuente: ‘Building a MENACE machine’, Matthew Scroggs

A continuación colocaremos nuestra ficha en la esquina inferior izquierda, y tras localizar la caja correspondiente a la situación de las fichas, en este cuarto turno saldrá el color naranja, y colocaremos la ficha correspondiente de MENACE. Finalmente ganaremos la partida a MENACE completando el 3 en raya en la fila inferior.

Fuente: ‘Building a MENACE machine’, Matthew Scroggs

Bien hasta ahora, estamos partiendo de la base de que nuestro juego o máquina MENACE solo conoce las reglas del 3 en raya, pero no sabe jugar bien, simplemente juega de forma aleatoria. ¿Cómo podría aprender a jugar bien?

Pensemos, ¿cuál es el proceso que seguiría una persona para aprender a jugar bien, de forma perfecta, al 3 en raya? El proceso sería, una vez conocidas las reglas, comenzar a jugar, y observar, a medida que pasan las partidas, qué jugadas han provocado que perdamos en alguna ocasión (para descartarlas en el futuro), y cuáles son los mejores movimientos (poner la primera ficha en el centro, por ejemplo) posibles. Podríamos decir que es un proceso idéntico para cualquier tipo de juego, y que requiere cierta inteligencia.

Pues bien, este es el proceso que se puede lograr que siga nuestra máquina MENACE, incluyendo las siguientes condiciones tras una partida:

  • Si ha sido derrotada se supone que habrá elegido malos movimientos y realizado jugadas inadecuadas. Por tanto, se eliminará de cada caja que ha participado en la partida la canica que ha salido.
  • Si logra un empate se añadirá en cada caja que ha participado en la partida una canica del mismo color que la que ha salido. (Si la otra persona también juega de forma perfecta, el juego acabará en empate, por ello se añaden).
  • Si logra una victoria se añadirá en cada caja que ha participado en la partida tres canicas del mismo color que la que ha salido.

De esta manera, al añadir la canica correspondiente a la posición que nos ha servido para empatar o ganar la partida, será más probable en las partidas futuras que se elija esa posición, y por tanto que se lleven a cabo los movimientos adecuados para llegar a jugar de forma perfecta.

Mediante este proceso, y a medida que pasan las partidas, veremos cómo hemos dotado de cierta inteligencia a nuestra máquina, que ha logrado aprender con el paso del tiempo. Tras un cierto número de partidas, la máquina logrará jugar de forma perfecta. Este podría ser un ejemplo muy básico de inteligencia artificial. La verdad es que es una idea muy original. Puedes ver aquí una construcción real de este juego con diferentes tipos de legumbres en lugar de con canicas de colores.

¿Y para otros juegos? ¿Sería posible realizar una máquina similar?

Efectivamente, podría ser construida para cualquier juego. Por ejemplo, pensemos en el juego Conecta 4 (puedes buscarlo en Google). Teóricamente se podría construir una máquina MENACE similar, el problema es que, en este caso, las posibles posiciones de las fichas durante el juego ya no son 304 como en el 3 en raya. En este caso serían muchísimas más, lo que lo haría simplemente inviable.

Podría ser incluso pensada para un juego como el ajedrez. En este caso, el problema sería que el número de posiciones posibles de las fichas del ajedrez es aproximadamente 1043, por lo que si elaboráramos dicha cantidad de cajas de cerillas, estas ocuparían prácticamente el tamaño de todo nuestro sistema solar. Sí, un poco inviable, parece ser.

 


Fuentes:
‘Building a MENACE machine’, Matthew Scroggs
http://shorttermmemoryloss.com/menace
http://slideplayer.com/slide/5079854/
Opt In Image
¡Suscríbete!
¿Quieres suscribirte gratis y recibir nuevas entradas y más? ¡¡Gracias!!

 

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *