Alphago – Techinfo

Definición: ¿Qué significa AlphaGo?

AlphaGo es una IA estrecha, un programa de computadora desarrollado por Google DeepMind para jugar Go, un juego de mesa de estrategia chino para dos jugadores similar al ajedrez. AlphaGo es el primer programa de IA que pudo vencer a un jugador humano profesional, el jugador de 2 dan Fan Hui en octubre de 2015, en un tablero de tamaño completo sin desventajas. Luego venció a uno de los jugadores humanos mejor clasificados del mundo, 9-dan Lee Sedol, en marzo de 2016, ganando cuatro juegos de cinco.

Techinfo explica AlphaGo

El proyecto AlphaGo se inició en 2014 como un banco de pruebas para ver qué tan bien el algoritmo de red neuronal de Google DeepMind que utiliza el aprendizaje profundo podría competir en Go. El algoritmo de AlphaGo es una combinación de técnicas de búsqueda de árbol y aprendizaje automático y se refuerza con un entrenamiento extenso con humanos y otros jugadores de computadora. Utiliza la búsqueda de árbol de Monte Carlo y se guía por una red de políticas y valores, implementada mediante tecnologías de redes neuronales profundas. La red de políticas está capacitada y ayuda a la IA a predecir el próximo movimiento con más probabilidades de ganar, mientras que la red de valor está capacitada para reducir el árbol de búsqueda y determinar el valor de esas posiciones, estimando los ganadores en cada posición en lugar de buscar hasta el final. hasta el final del juego.

AlphaGo se alimentó por primera vez con movimientos de partidos históricos de jugadores humanos, utilizando una base de datos de alrededor de 30 millones de movimientos, lo que imita los juegos humanos. Una vez que la IA alcanzó un grado de competencia, se entrenó más haciéndola jugar contra instancias de sí misma, utilizando el aprendizaje por refuerzo para mejorar y aprender más.

En octubre de 2015, una versión de computación distribuida de AlphaGo jugó y derrotó a Fan Hui, un campeón europeo de Go de 2 dan, marcando la primera vez que un programa de computadora venció a un jugador profesional en Go. Fan Hui luego ayudó como consultor del equipo DeepMind meses después de su derrota. En marzo de 2016, AlphaGo se enfrentó a Lee Sedol, uno de los jugadores mejor clasificados del mundo, habiendo alcanzado el nivel superior de 9 dan. Al ganar cuatro juegos frente al de Lee, esto marcó un gran avance en la investigación de inteligencia artificial, ya que esto significó que el algoritmo de aprendizaje profundo y redes neuronales utilizado por DeepMind se puede usar para cualquier otro propósito, ya que en realidad no fue programado para jugar Go, sino que fue enseñado cómo jugar Go. Esto abre un mundo completamente nuevo para la investigación de la IA.