Un paso gigante en una máquina de ajedrez

Pedro Luis Martín Olivares
Pedro Luis Martín Olivares - Un paso gigante en una máquina de ajedrez

Pedro Luis Martín Olivares– El asombroso éxito de AlphaZero, un algoritmo de aprendizaje profundo, anuncia una nueva era de conocimiento, una que, para los humanos, puede que no dure mucho.

En el Concurso de Desafío DeepMind de Google entre el programa de inteligencia artificial AlphaGo, un antecesor de AlphaZero, y el jugador profesional de Corea del Sur, Lee Sedol, en una tienda de electrónica en Seúl en 2016, el resultado fue: la computadora ganó el partido.

A principios de diciembre, investigadores de DeepMind, la compañía de inteligencia artificial propiedad de la empresa matriz de Google, Alphabet Inc., hicieron una presentación desde las fronteras del ajedrez.

Un año antes, el 5 de diciembre de 2017, el equipo había sorprendido al mundo del ajedrez con su anuncio de AlphaZero, un algoritmo de aprendizaje automático que dominaba no solo el ajedrez sino también el Shogi, o el ajedrez japonés, y el Go. El algoritmo comenzó sin conocimiento de los juegos más allá de sus reglas básicas. Luego jugó contra sí mismo millones de veces y aprendió de sus errores. En cuestión de horas, el algoritmo se convirtió en el mejor jugador, humano o computador que el mundo haya visto.

Los detalles de los logros y el funcionamiento interno de AlphaZero ahora han sido formalmente revisados ​​por pares y publicados en la revista Science este mes. El nuevo artículo aborda varias críticas serias de la afirmación original. Entre otras cosas, era difícil saber si AlphaZero estaba jugando con total imparcialidad contra su oponente, una bestia computacional llamada Stockfish. AlphaZero no se ha fortalecido en los últimos doce meses, pero sí se evidencia su superioridad. Muestra claramente una raza de intelecto que los humanos no han visto antes, y que nos obliga a reflexionar.

El ajedrez informático ha recorrido un largo camino en los últimos veinte años. En 1997, Deep Blue, el programa de juego de ajedrez de I.B.M., logró vencer al actual campeón del mundo humano, Garry Kasparov, en un partido de seis juegos. En retrospectiva, había poco misterio en este logro. Deep Blue podría evaluar 200 millones de posiciones por segundo. Nunca se cansó, nunca cometió errores de cálculo y nunca olvidó lo que había estado pensando un momento antes.

Para bien y para mal, jugó como una máquina, brutal y materialista. Podría superar al señor Kasparov, pero no pudo hacerlo a él. En el juego 1 de su partida, Deep Blue aceptó con avidez el sacrificio de Kasparov de una torre por un obispo, pero perdió el juego 16 movimientos más tarde. La generación actual de los programas de ajedrez más fuertes del mundo, como Stockfish y Komodo, aún juegan en este estilo inhumano. Les gusta capturar las piezas del oponente. Ellos defienden como el hierro, pero aunque son mucho más fuertes que cualquier jugador humano, estos “motores” de ajedrez no tienen una comprensión real del juego. Tienen que ser tutelados en los principios básicos del ajedrez.

Estos principios, que se han refinado a lo largo de décadas de la experiencia del gran maestro humano, están programados en los motores como funciones de evaluación complejas. Indican qué buscar en una posición y qué evitar: cuánto valorar la seguridad del rey, la actividad de la pieza, la estructura del peón, el control del centro, y más, y cómo equilibrar las compensaciones entre ellos. Los motores de ajedrez de hoy, innatamente ajenos a estos principios, se ven como unos brutos: tremendamente rápidos y fuertes, pero carecen por completo de información.

Todo eso ha cambiado con el auge del aprendizaje automático. Al jugar contra sí mismo y actualizar su red neuronal a medida que aprendía de la experiencia, AlphaZero descubrió los principios del ajedrez por su cuenta y rápidamente se convirtió en el mejor jugador de todos los tiempos. No solo pudo haber derrotado fácilmente a todos los maestros humanos más fuertes, sino que ni siquiera se molestó en intentarlo, sino que aplastó a Stockfish, el actual campeón mundial de ajedrez en computadoras. En un partido de cien partidos contra un motor verdaderamente formidable, AlphaZero obtuvo veintiocho victorias y setenta y dos empates. No perdió un solo juego.

Lo más desconcertante fue que AlphaZero parecía expresar su percepción. Jugó como ninguna computadora lo ha hecho, intuitiva y elegante, con un estilo de ataque romántico. Jugó gambitos y tomó riesgos. En algunos juegos paralizó a Stockfish y jugó con él. Mientras conducía su ataque en el Juego 10, AlphaZero retiró a su reina de vuelta a la esquina del tablero en su propio lado, lejos del rey de Stockfish, que normalmente no es donde debería colocarse una reina atacante.

Sin embargo, este retiro peculiar fue venenoso: no importaba cómo respondiera Stockfish, estaba condenado. Era casi como si AlphaZero estuviera esperando que Stockfish se diera cuenta, después de miles de millones de cálculos brutales, de cuán desesperada era realmente su posición, para que la bestia pudiera relajarse y expirar pacíficamente, como un toro vencido ante un matador. Los grandes maestros nunca habían visto algo así. AlphaZero tenía la delicadeza de un virtuoso y el poder de una máquina. Fue la primera visión de la humanidad de un nuevo e impresionante tipo de inteligencia.

Pedro Luis Martín Olivares

Pedro Luis Martín Olivares – Un paso gigante en una máquina de ajedrez

Cuando AlphaZero se dio a conocer por primera vez, algunos observadores se quejaron de que Stockfish había sido lobotomizado al no darle acceso a su libro de aperturas memorizadas. Esta vez, incluso con su libro, fue aplastado de nuevo. Y cuando AlphaZero se perjudicó al darle a Stockfish diez veces más tiempo para pensar, aun así todavía destruyó al bruto.

Es revelador que AlphaZero ganó pensando más inteligentemente, no más rápido; examinó solo 60 mil posiciones por segundo, en comparación con 60 millones para el stockfish. Era más sabio, saber qué pensar y qué ignorar. Al descubrir los principios del ajedrez por sí solo, AlphaZero desarrolló un estilo de juego que “refleja la verdad” sobre el juego en lugar de “las prioridades y los prejuicios de los programadores”, escribió Kasparov en un comentario que acompaña al artículo de Science.

La pregunta ahora es si el aprendizaje automático puede ayudar a los humanos a descubrir verdades similares sobre las cosas que realmente nos interesan: los grandes problemas no resueltos de la ciencia y la medicina, como el cáncer y la conciencia; los enigmas del sistema inmunológico, los misterios del genoma.

Las primeras señales son alentadoras. En agosto pasado, dos artículos en Nature Medicine exploraron cómo el aprendizaje automático podría aplicarse al diagnóstico médico. En uno, los investigadores de DeepMind se unieron a los médicos del Moorfields Eye Hospital en Londres para desarrollar un algoritmo de aprendizaje profundo que pudiera clasificar una amplia gama de patologías retinales con mayor precisión que los expertos humanos. La oftalmología sufre de una grave escasez de expertos que pueden interpretar los millones de exámenes oculares de diagnóstico realizados cada año, los asistentes artificialmente inteligentes podrían ayudar enormemente.

El otro artículo se refería a un algoritmo de aprendizaje automático que decide si una tomografía computarizada de un paciente de la sala de emergencia muestra signos de un derrame cerebral, una hemorragia intracraneal u otro evento neurológico crítico. Para las víctimas de accidentes cerebrovasculares, cada minuto importa. Cuanto más se retrasa el tratamiento, peor es el resultado. Los neurólogos tienen un sombrío dicho: “El tiempo es cerebro”. El nuevo algoritmo marcó estos y otros eventos críticos con una precisión comparable a la de los expertos humanos, pero lo hizo 150 veces más rápido. Un especialista en diagnóstico más rápido podría permitir que los casos más urgentes se analicen antes, con la revisión de un radiólogo humano.

Sin embargo, lo que es frustrante sobre el aprendizaje automático es que los algoritmos no pueden articular lo que están pensando. No sabemos por qué funcionan, por lo que no sabemos si se puede confiar en ellos. AlphaZero da la impresión de haber descubierto algunos principios importantes sobre el ajedrez, pero no puede compartir esa comprensión con nosotros. Todavía no, al menos. Como seres humanos, queremos más que respuestas. Queremos perspicacia. Esto va a ser una fuente de tensión en nuestras interacciones con las computadoras de ahora en adelante.

De hecho, en matemáticas, esto ya está sucediendo desde hace años. Considere el problema matemático de larga data llamado teorema de mapas de cuatro colores. Propone que, bajo ciertas restricciones razonables, cualquier mapa de países contiguos siempre se puede colorear con solo cuatro colores, de modo que no haya dos países vecinos del mismo color.

Aunque el teorema de los cuatro colores fue probado en 1977 con la ayuda de una computadora, ningún ser humano pudo verificar todos los pasos del argumento. Desde entonces, la prueba ha sido validada y simplificada, pero todavía hay partes de la misma que implican el cálculo de fuerza bruta, del tipo empleado por los ancestros informáticos de AlphaZero que juegan al ajedrez. Este desarrollo molestó a muchos matemáticos. No necesitaban que les aseguraran que el teorema de los cuatro colores era cierto. Ya lo creyeron. Querían entender por qué era cierto, y esta prueba no ayudó.

Pero imagínese un día, quizás en un futuro no muy lejano, cuando AlphaZero haya evolucionado hacia un algoritmo más general de resolución de problemas, llámalo AlphaInfinity, al igual que su antecesor, tendría una visión suprema: podría crear hermosas pruebas, tan elegantes como los juegos de ajedrez que AlphaZero jugó contra Stockfish. Y cada prueba revelaría por qué un teorema era verdadero. AlphaInfinity no se limitaría a obligarte a aceptarla con algún argumento complicado y difícil.

Para los matemáticos y científicos humanos, este día marcaría el comienzo de una nueva era de percepción, pero puede que no dure. A medida que las máquinas se vuelven cada vez más rápidas, y los humanos se mantengan con sus neuronas funcionando a escalas de tiempo de milisegundos, otro día seguirá cuando ya no podamos continuar. El amanecer de la intuición humana puede volverse rápidamente en atardecer.

Supongamos que existen patrones más profundos por descubrir, en la forma en que los genes están regulados o el cáncer progresa, en la orquestación del sistema inmune, en la danza de las partículas subatómicas. Y supongamos que estos patrones se pueden predecir, pero solo con una inteligencia muy superior a la nuestra. Si AlphaInfinity pudiera identificarlos y comprenderlos, nos parecería un oráculo.

Nos sentaríamos a sus pies y escucharíamos atentamente. No entenderíamos por qué el oráculo siempre tuvo la razón, pero podríamos verificar sus cálculos y predicciones contra experimentos y observaciones, y confirmar sus revelaciones. La ciencia, que es señal de esfuerzo humano, reduciría nuestro papel al de los espectadores, boquiabierto de asombro y confusión.

Tal vez con el tiempo nuestra falta de comprensión ya no nos molestaría. Después de todo, AlphaInfinity podría curar todas nuestras enfermedades, resolver todos nuestros problemas científicos y hacer que todos nuestros otros trenes intelectuales funcionen a tiempo. Lo hicimos bastante bien sin mucho conocimiento durante los primeros 300,000 años de nuestra existencia como Homo sapiens. Y no nos faltará ningún recuerdo: recordaremos con orgullo la época dorada de la intuición humana, este interludio glorioso, de unos pocos miles de años, entre nuestro pasado incomprensible y nuestro incomprensible futuro.

Sabías que puedes leer esta artículo y otros en Telegram
Telegram Messenger 1 - Un paso gigante en una máquina de ajedrez

Pedro Luis Martín Olivares
Economía y Finanzas

Be the first to comment on "Un paso gigante en una máquina de ajedrez"

Deja un comentario

Tu dirección de correo no será publicada.


*


*