tecnología

AlphaZero: la IA de DeepMind se vuelve inmejorable en ajedrez

tecnología AlphaZero: la IA de DeepMind se vuelve inmejorable en ajedrez

El Fin de los Humanos, Deepmind Alphazero Consigue IA Humana (Julio 2019).

Anonim

DeepMind, una filial de Google, ha realizado una nueva demostración del rendimiento de su programa de inteligencia artificial. AlphaZero, una variación de AlphaGo que practica el aprendizaje de refuerzo, tomó solo cuatro horas desde las reglas básicas para derrotar al mejor programa de ajedrez actual.

Después de demostrar la superioridad implacable de la inteligencia artificial (AI) en el juego de ir, DeepMind, subsidiaria de Google, ahora busca hacerlo más general. El objetivo es crear una IA que pueda realizar tareas complejas en el mundo real con un conocimiento previo mínimo. Para esto, el programa debe poder evolucionar de forma autónoma sin depender del aprendizaje supervisado por humanos.

$config[ads_text] not found

No hace mucho, DeepMind dio un paso importante en esta dirección con AlphaGoZero, una nueva versión de su programa Go Game, que tardó solo tres días en derrotar a su predecesor mediante la práctica de un aprendizaje de "tabula rasa" a través del refuerzo. aprendiendo, en inglés). AlphaGo Zero solo tenía las reglas del juego y la posición de las piedras en el tablero. Desde esta base, ella fue un poco más allá.

En un nuevo artículo científico, DeepMind presenta AlphaZero, que utiliza el principio de refuerzo de autoaprendizaje en un enfoque menos especializado. Con la única base de las reglas de ajedrez, go y shogi (juego de ajedrez japonés), esta IA ha logrado alcanzar un "nivel de juego sobrehumano" y superar los mejores programas en las tres disciplinas.

Shogi es una variante del ajedrez practicada en Japón. © Estivillml, Fotolia

AlphaZero derrotó a Stockfish en cuatro horas

El rendimiento es aún más impresionante porque le llevó menos de veinticuatro horas lograrlo:

  • Después de ocho horas de entrenamiento y 21 millones de juegos contra sí mismo, AlphaZero venció a AlphaGo-Lee, el primer IA en haber dominado a un jugador humano.
  • Para el ajedrez, AlphaZero solo necesitó cuatro horas de práctica y 44 millones de juegos para vencer a Stockfish, uno de los mejores motores de ajedrez de la actualidad.
  • Dos horas y 24 millones de juegos fueron suficientes para derrotar a Elmo, el mejor programa de shogi.

Esta versatilidad y velocidad acercan a DeepMind y Google a su objetivo de crear una inteligencia artificial generalista que pueda funcionar en áreas del mundo real, especialmente para la ciencia y la medicina. Google también obtendrá muchos beneficios para desarrollar sus propios servicios. El próximo gran desafío para DeepMind y su empresa matriz será vencer a los humanos en el videojuego StarCraft.

Lo que hay que recordar

  • El nuevo programa AlphaZero de inteligencia artificial (AI) de DeepMind es capaz de aprender tres juegos de tablero diferentes por sí mismo sin utilizar datos humanos.
  • Esta versátil IA solo tomó unas pocas horas para superar al mejor software de ajedrez y shogi.

Para saber más

AlphaGo Zero: la inteligencia artificial de Google DeepMind se auto educa

Artículo original de Marc Zaffagni, publicado el 19/10/2017

AlphaGo Zero, una nueva versión del programa de juego de DeepMind, tardó solo tres días en derrotar a su predecesor AlphaGo después de entrenar con solo las reglas del juego y la posición de las piedras en el tablero. Un paso más hacia la creación de una inteligencia artificial generalista.

"Domina el juego de Go sin conocimiento humano" .Este es el título del artículo publicado en la revista Nature por DeepMind que resume la nueva hazaña lograda por la filial de Alphabet (empresa matriz de Google) especializada en inteligencia artificial (AI). Sus equipos han creado una nueva versión del software AlphaGo que ha aprendido a jugar sin la menor cantidad de datos o conocimiento humano. AlphaGo Zero, es su nombre, tenía a su disposición solo las reglas de este juego milenario y la ubicación de las piedras blancas y negras en el tablero.

A partir de esta base, el algoritmo de búsqueda combinado con una neuronala de red jugó miles de partes contra sí mismo al mejorar constantemente su nivel. Después de solo tres días, el programa destruyó AlphaGo Lee, el software que derrotó al campeón Lee Sedol, ganando 100 victorias en 0. Después de 21 días de autoaprendizaje, AlphaGo Zero estaba en el nivel AlphaGo Master. versión que derrotó al número mundial 1Ke Jieen en mayo pasado. Y 40 días después del comienzo de su entrenamiento, AlphaGo Zero ha superado todas las versiones existentes para convertirse simplemente en el mejor jugador de go del planeta.

Una "tabula rasa" de aprendizaje

La principal diferencia técnica entre AlphaGo Zero y sus predecesores es que se basa únicamente en la técnica de aprendizaje de refuerzo .Los otros AlphaGos combinaron este método con el aprendizaje supervisado impulsado por partes de referencia interpretadas por humanos.

Además, AlphaGo Zero usa solo una red neuronal de aprendizaje profundo contra dos previamente. Anteriormente, el software de DeepMind combinaba una "red de decisión" que decidía el siguiente paso para jugar una "red de valor" que predijo al ganador del juego desde las posiciones actuales en el tablero. AlphaGo Zero ha fusionado estas dos redes neuronales para ganar eficiencia y ni siquiera necesita jugar juegos aleatorios rápidos para predecir el resultado del juego.

"Esta técnica es más poderosa que las versiones anteriores de AlphaGo porque ya no está limitada por los límites del conocimiento humano. En cambio, puede aprender de una hoja limpia con el jugador más fuerte del mundo: AlphaGo en sí mismo ", dice DeepMind en su blog.

Este gráfico muestra la curva de aprendizaje de AlphaGo Zero que tardó solo tres días en vencer a AlphaGo Lee y 40 días para establecerse como el mejor jugador del mundo. © DeepMind

AlphaGo Zero ha sido creativo

No satisfecho con ser inmejorable a partir de información mínima, AlphaGo Zero ha impresionado a sus creadores por su capacidad para apropiarse del juego. Después de asimilar lo básico y reproducirlo sin ayuda de fuera de las estrategias de juego desarrolladas por los humanos durante años. Hace miles de años, el programa dio un paso más al crear aperturas totalmente nuevas. AlphaGo Zero literalmente ha inventado nuevas formas de juego, todo dentro de unos días.

Según DeepMind, tales capacidades abren perspectivas prometedoras para la creación de IAcapables para trabajar en campos concretos: salud, consumo de energía, ciencia de los materiales. "Tienes un agente (una IA, nota del editor) que puede transponerse desde el juego de ir a cualquier otro dominio (…). Obtiene un algoritmo que se vuelve tan general que puede aplicarse en cualquier lugar ", dice David Silver, investigador en jefe de AlphaGo.

Sin embargo, aunque puede evolucionar sin datos humanos, un programa como AlphaGo Zero necesita trabajar en un problema estructurado con reglas claras y un mínimo imprevisto. Es por eso que después del juego de ir, DeepMind ha decidido abordar el juego de estrategia Estrategia de Starcraft donde la gestión de la incertidumbre es mucho más compleja. La compañía busca el mismo éxito que el juego de ir con el fondo de crear una IA capaz de realizar tareas complejas en el mundo real.


AlphaGo: Después de derrotar al juego número 1 del mundo, la IA se retira

Artículo original de Marc Zaffagni, publicado el 29/05/2017

AlphaGo ha ganado los tres juegos contra el asesino número uno del mundo, Ke Jie. La inteligencia artificial de DeepMind (Google) ya no se utilizará para este tipo de exposición. Ahora se usará para avanzar en la investigación científica y médica.

Una inteligencia artificial (AI) definitivamente afirmó su superioridad contra el hombre en el juego de go. AlphaGo, el programa desarrollado por DeepMind (una subsidiaria de Google), ganó las tres rondas opuestas al número uno del mundo, el chino Ke Jie. SiDemis Hassabis, el fundador y jefe de DeepMind, evitó todo triunfalismo y saludó al formidable oponente de AlphaGo, el resultado de la pelea dejó pocas dudas.

De hecho, desde su aparición en la escena de los medios con motivo de su enfrentamiento contra los campeones Fan Hui y Lee Sedol, esta IA ha mejorado constantemente jugando millones de juegos contra sí mismo. Entonces, solo era cuestión de tiempo y poder antes de que finalmente se impusiera la máquina. A principios de este año, AlphaGo ya había vencido a Ke Jie jugando una serie de juegos en Internet con seudónimos. Esta nueva victoria "oficial" contra el mundo n ° 1 viene a cerrar el debate sobre la capacidad de una máquina para dominar este juego milenario que da orgullo a la intuición.

Al no tener nada que probar en el juego, AlphaGo se retirará. DeepMind ha anunciado que esta competencia fue la última para su inteligencia artificial. "El equipo de investigación detrás de AlphaGo ahora centrará sus energías en el próximo conjunto de desafíos principales, desarrollando algoritmos avanzados de propósito general que algún día pueden ayudar a los científicos a abordar algunos de nuestros problemas más complejos", dice. leer en la publicación del blog publicada por DeepMind.

Correcto, el jugador número uno del mundo, Ke Jie, en su enfrentamiento final contra IA AlphaGo. El joven trató de desestabilizar la implacable mecánica haciendo disparos considerados no convencionales. Nada ha hecho. © DeepMind

Para Google, AlphaGo es solo el comienzo de un gran proyecto

Se trata de utilizar el poder de AlphaGo para ayudar a combatir ciertas enfermedades, reducir el consumo de energía o inventar nuevos materiales. Uno de los principales beneficios de la inteligencia artificial en seres humanos en este tipo de proyecto ambicioso es su capacidad para tomar prestados terabytes de datos heterogéneos y extraer significado de ellos. Los fundadores de Googlene no ocultan sus ambiciones transhumanistas y ven la inteligencia artificial como una forma de aumentar las capacidades humanas.

En su última conferencia anual de Google I / O, el gigante de California se ha centrado en la inteligencia artificial y en el papel cada vez más importante que tiene que desempeñar en sus productos y servicios. El trabajo de DeepMind y la plataforma TensorFlow serán la clave de esta estrategia.

Pero antes de continuar, el equipo de DeepMind eligió hacer algunos últimos regalos a la comunidad de jugadores. Primero, la compañía lanzó cincuenta juegos jugados por la propia AlphaGocontre para entrenar. A continuación, se publicará un artículo que detalla cómo la IA estuvo preparada para enfrentar a Ke Jie en los próximos meses. El campeón chino también acordó trabajar con DeepMind para desarrollar una herramienta de aprendizaje que muestre cómo AlphaGo analiza las posiciones de los juegos para prepararse para sus movimientos.


Juego de ir: AlphaGo gana su primer duelo contra el número 1 del mundo

Artículo original de Relaxnews, publicado el 24/05/2017

Con motivo de la Cumbre Go for the Future en China, DeepMind's IA AlphaGo de Google se ha embarcado en una serie de juegos que incluyen verlo enfrentarse al número uno del mundo actual, Ke Jie de China.El primer duelo se convirtió en una ventaja para la máquina, pero la lucha fue dura.

La supercomputadora de Google una vez más venció a los humanos al vencer el martes al pequeño genio chino de la marcha, el juego de estrategia asiático milenario. La computadora AlphaGoa ganó el primero de tres juegos (ver el resumen en YouTube) contra el número uno del mundo Ke Jie, de 19 años, quien rápidamente se aseguró de vencer a "una máquina sin alma" .La inteligencia artificial tenía la ventaja, pero a poco, ganaba con solo medio punto por adelantado.

AlphaGo, desarrollado por DeepMind Technologies, una filial de Google especializados en inteligencia artificial y con sede en Londres, ya había causado sensación el año pasado al derrotar al gran líder surcoreano Lee Se-Dolpar en cuatro juegos a uno. Era la primera vez que un software aplastaba a un jugador experimentado durante un partido completo.

La victoria de AlphaGo fue aclamada como un avance tecnológico para las computadoras, ahora capaz no solo de conducir automóviles sino también de ayudar a la humanidad a resolver algunos de los problemas científicos, técnicos o médicos más difíciles. AlphaGo está equipado con algoritmos que le permiten aprender de sus experiencias.

El go-kar chino Ke Jie no se desesperó con la AlphaGo AI, que ganó el día. © DeepMind

Dos juegos más por venir entre Ke Jie y AlphaGo

El joven Ke Jie, que se describe a sí mismo como "pretencioso", luego asumió el desafío. Pero ya había tenido que retroceder a principios de año después de haber sido derrotado en un combate en línea por un misterioso oponente. Más tarde se supo que era AlphaGo. Antes del partido de este martes en Wuzhen (este de China), el jugador, campeón del mundo por más de dos años, había asegurado que sería su última pelea contra AlphaGo, él gana o que él está perdiendo.

Ya en 1997, el campeón mundial de ajedrez Garry Kasparov había sido derrotado por la computadora Deep Blue de IBM. Pero el desafío para la máquina parecía mucho más en el juego de ir, en el que dos oponentes intentan ocupar el mayor espacio en una cuadrícula colocando alternativamente piedras blancas y negras.

El tamaño del mazo (19 líneas de un total de 19) ofrece innumerables configuraciones posibles, más que átomos en el universo, y el juego sigue conceptos estratégicos que van más allá del simple cálculo. matemática, tan poderosa como es. Lo que significa que la intuición y la creatividad son esenciales para ganar a un nivel muy alto. Dos dominios en los que el humano, se creía, era necesariamente superior a la máquina. Kie Jie y AlphaGo se enfrentarán nuevamente el próximo jueves y sábado. Los partidos comenzarán a las 4:30 de la mañana en Francia y la mayoría de la mañana los seguirá en vivo a través del canal YouTubeTubeDeepMind.


Una nueva versión de AlphaGo venció al número 1 del mundo

Artículo original de Marc Zaffagni, publicado el 14/01/2017

DeepMind, la filial de Google, ha probado silenciosamente una nueva versión de su juego, AI. Bajo los seudónimos "Master (P)" y "Magister (P)", AlphaGo se ha enfrentado a grandes campeones en dos plataformas de juego en línea y ha ganado más de 50 juegos. El programa incluso venció al número uno del mundo, el chino Ke Jie.

Después de la resonante victoria de su inteligencia artificial, el campeón surcoreano Lee Sedol, Demis Hassabis, jefe de DeepMind (filial de Google especializada en inteligencia artificial) había planteado la posibilidad de enfrentar el actual juego número uno del mundo. ve, el chino Ke Jie. Aunque aún no se ha programado una reunión oficial, AlphaGo ya ha derrotado a este prodigio de 19 años … sin darse cuenta.

DeepMind llega a revelar a través de la voz de Demos Hassabis que había probado silenciosamente una nueva versión de su IA en Tygem y FoxGo, dos servidores de juego frecuentados por los mejores campeones. Para pasar desapercibido, AlphaGo fue adornado con dos seudónimos, "Maestro (P)" y "Magister (P)". La IA jugó entre el 29 de diciembre y el 4 de enero y ganó más de 50 rangos.

AlphaGo debería enfrentar a un nuevo campeón go este año

Además de Ke Jie, hay otros grandes nombres como Park Jung-hwan (Corea del Sur), Gu Li (China) e Iyama Yuta (Japón). Un resultado impresionante que sigue siendo relativo en la medida en que los juegos en línea se jugaron en modo acelerado que se considera más favorable para la máquina.

Demis Hassabis también ha indicado que esta nueva versión de AlphaGo se requerirá para tocar partes clásicas de longueduréeet oficialmente durante el transcurso del año. Queda por ver qué gran campeón de go acordará frotar esta IA que ahora parece casi imposible de vencer …


Juego Go: la inteligencia artificial de Google supera al humano

Artículo de Marc Zaffagni, publicado el 28/01/2016

AplhaGo, un programa de inteligencia artificial desarrollado por DeepMind, una subsidiaria de Google, venció a un jugador profesional. Un gran avance que no se esperaba antes de diez años. El anuncio acaba de hacerse en el momento de una publicación científica. Qué descifrar la realización y el método, con las redes neuronales y el aprendizaje. Abróchense los cinturones y buceen con nosotros en el funcionamiento de AlphaGo, que desafiará al campeón del mundo el próximo mes de marzo y que, sin duda, también se habrá alejado del juego …

Esta semana puede considerarse histórica para la inteligencia artificial. Por un lado, perdió a uno de sus padres, Marvin Minskyet, por otro lado, dio un gran paso en su perfección. Google anunció que su filial DeepMind había desarrollado una inteligencia artificial que venció a un jugador profesional. NamedAlphaGo, el programa superó a Fan Hui, el tres veces campeón de Europa en el juego de ir, ganando cinco victorias desde cero. El choque tuvo lugar el pasado octubre, pero Google quería esperar la publicación del artículo científico dedicado a este desafío en la revista Nature antes de anunciar esta hazaña.

¿Por qué es esta victoria tan importante? Porque, después del éxito de la computadora Deep Blueface para el campeón mundial de ajedrez Gary Kasparov en 1997, el juego siguió siendo el único rompecabezas para resistir las máquinas. Hace poco más de un año, los expertos que desarrollaron los programas de go go más exitosos, como el francés Stonedu Rémi Coulom, pensaron que tomaría una década o más antes una máquina no puede vencer a un humano.

Las reglas de go son simples: dos jugadores se enfrentan en un tablero donde colocan piedras en blanco y negro para delimitar territorios y capturar las piezas del oponente. El objetivo final es controlar más de la mitad del tablero. Pero esta aparente simplicidad esconde una complejidad profunda porque este juego se basa principalmente en la intuición. "El número de combinaciones posibles es mayor que el número de átomos en el universo", resume Demis Hassabis, uno de los fundadores de la compañía británica DeepMind que Google adquirió en 2014. Las técnicas de inteligencia artificial basadas en la fuerza Brute, quien construyó un árbol de investigación para probar todas las posibilidades de movimiento, hasta ahora no tenía ninguna posibilidad de éxito con el juego de go.

El algoritmo aprende jugando contra sí mismo

Para lograr este golpe maestro, DeepMind ha combinado las mejores técnicas de inteligencia artificial y poder de cómputo disponibles a través de la plataforma informática de Google. En el corazón del dispositivo, dos redes neuronales de aprendizaje profundo tienen cada una una tarea diferente. La primera red de políticas llamada (algo así como "red política" o "red de decisión") funciona para predecir el próximo movimiento, mientras que la segunda red de valor considera el resultado favorable de un movimiento. desde la configuración del tablero de juego.

Ambas redes se han asociado con un árbol binario de búsqueda que utiliza el algoritmo llamado Monte Carlo Monte Carlo, que es la base del software de juego más exitoso del momento (Crazy Stone y Zen). Consiste en jugar todos los fines de los juegos posibles desde una posición contando las partes ganadoras y perdedoras. Las redes neuronales están ahí para refinar la investigación, reducir su complejidad y profundidad, adoptando una forma de razonamiento más cercana a la imaginación humana.

Cada red está compuesta de doce capas, cada una con millones de conexiones neuronales. Las "redes políticas" se capacitaron con una base de datos de 30 millones de visitas de juegos jugadas por expertos hasta que pudieron predecir un movimiento el 57% del tiempo. Pero para que AlphaGo desarrolle sus propias estrategias de juego, DeepMind ha recurrido a un aprendizaje mejorado haciendo que juegue miles de juegos contra sí mismo. Luego, las "redes políticas" se usaron para impulsar "redes de valores", siempre a través de un aprendizaje mejorado. "Estas valiosas redes pueden evaluar cualquier posición de salida y estimar el posible ganador", dice Google.

Obviamente, este ambicioso programa no podría haber tenido éxito sin la potencia de cómputo y la capacidad de almacenamiento que el gigante norteamericano ha proporcionado a través de su red de computación en la nube. Además, el equipo de DeepMind utilizó la plataforma de intelligenceTensorFlow, que Google lanzó recientemente el código fuente. Entonces no quedaba nada más que enviar AlphaGo para desafiar a un jugador profesional. Pero antes de eso, a modo de calentamiento, por así decirlo, se enfrentó al mejor software del momento. Instalado en una sola máquina, AlphaGo ganó 499 de los 500 juegos jugados.

El campeón europeo defensor Fan Hui es el primer jugador profesional que pierde ante AlphaGo. © DeepMind, YouTube

¿Cómo se usará esta inteligencia artificial?

Enfrentado con Fan Hui, jugador chino francés campeón europeo en el título, el programa de DeepMind no ha hecho ningún detalle, ganando cinco victorias contra cero para su oponente. "Con AlphaGo, jugamos durante cinco días, con dos juegos al día, uno normal y uno rápido. Perdí 5-0 juegos normales, 3-2 juegos rápidos. Como juega muy rápido, debería haber perdido más en los juegos rápidos, pero fue todo lo contrario, dice Fan Hui en una entrevista con Le Monde . No tenía la impresión de jugar contra una computadora. Él juega como un humano .Probablemente el mejor cumplido que podría recibir AlphaGo …

Pero Google no tiene la intención de detenerse allí. El próximo desafío para su IA será intentar vencer al campeón mundial Lee Sedol. El partido tendrá lugar el próximo marzo en Seúl y el partido se transmitirá en vivo a través de YouTube DeepMind. "Tendré el privilegio de enfrentarme a una computadora por primera vez. Escuché que AlphaGo es sorprendentemente fuerte y mejorará nuevamente, pero estoy seguro de que puedo ganar, al menos esta vez ", dijo Lee Sedol.

Cualquiera que sea el resultado de esta última confrontación, AlphaGo ya ha dado un gran salto en inteligencia artificial. Pero más allá del juego de ir, la gran pregunta es qué pretende hacer Google con esta gran herramienta. "Aunque los juegos son la plataforma ideal para desarrollar y probar rápidamente algoritmos de inteligencia artificial, al final queremos aplicar estas técnicas a problemas importantes del mundo real", dice la compañía, citando como ejemplo y el diagnóstico de enfermedades complejas. También podemos pensar que Google explotará esta tecnología para perfeccionar sus propios servicios, incluido su motor de búsqueda y su asistente vocal para teléfonos móviles.

Durante la conferencia de prensa posterior a la presentación de AlphaGo, se le preguntó a Demis Hassabis sobre los riesgos potenciales a largo plazo de una inteligencia artificial tan efectiva. Él respondió que su compañía colaboró ​​en este tema con académicos, organizó conferencias y tuvo un comité de ética interno. "Por otro lado, hemos acordado con Google que estas tecnologías no se utilizan con fines militares", dijo.

Entradas Populares