La campeona de bridge Sharon Osberg una vez escribió, "Jugar bridge es como manejar un negocio. Se trata de caza, persecusión, molestias, engaños, recompensas, peligro y, en un buen día, victoria."
Mientras que no es una sorpresa que el ajedrez cayera ante supercomputadoras procesadoras de números hace bastante tiempo, un juego de información incomplete, cooperación y comunicación astuta. Por más de un milenio, nuestros cerebros han evolucionado para leer expresiones faciales sutíles y lenguaje corporal. Hemos ensamblado sociedades desmadejadas dependientes en la competición y cooperación de milliones. Seguramente esas habilidades están fuera del alcances de las máquinas... ¿o no?
Por ahora, si. Pero tal vez no para siempre. En años recientes, la IA más avanzada ha empezado a invadir algo del territorio que orgullosamente defendíamos; la habilidad de navear mundo incierto donde la información es limitada, el juego tiene matices infinitos, y nadie triunfa solo.
La iniciativa francesa NukkAI tomó otro paso cuando su IA jugadora de bridge llamada NooK venció a ocho campiones de bridge del mundo en una competición en París.
El juego estaba simplificado, y NooK no se enfrentó cara a cara con los jugadores humanos exactamente, de lo que hablaremos más adelante, pero el rendimiento del algoritmo fue espectacular. Notablemente, NooK es un tipo de algoritmo híbrido, combinando IA simbólica (basada en reglas) con el acercamiento dominante actual de deep-learning. También, en contraste a sus equivalentes de deep-learning puro, NooK es más transparente y puede explicar sus acciones.
"Lo que hemos visto representa un avance fundamentalmente importante en el estado de los sistemas artificiales de inteligencia," dijo a The Guardian, Sthephen Muggleton, un profesor de machine-learning en el Colegio Imperial de Londres. En otras palabras, nada mal para una computadora fría y calculadora.
Para jugar bridge, tal vez el juego de cartas o tablero más complicado enfrentado por una IA, el equipo NukkAI combinó aprendizaje reforzado profundo con AI simbólica, un acercamiento usado famosamente por Deep Blue de IBM para derrotar a Garry Kasparov en ajedrez en los 90s.
Los algoritmos de aprendizaje de refuerzo profundo están conformados por una red de neuronas artificiales interconectadas. Para aprender un juego, un algoritmo juega contra él mismo billones de veces, evalúa sus rendimiento después de cada ronda, y mejora incrementalmente al ajustar y reajustar sus conexiones neurales hasta que finalmente domina el juego.
La AI simbólica, por otro lado, está basado en reglas. Los ingenieros de sofware escriben las reglas en el código que la AI requiere saber para tener éxito. Estas pueden ser, por ejemplo, que un alfil puede moverse diagonalmente cualquier número de espacios en un tablero de ajedrez, o que si un oponente sigue una estrategia partícular, el emplear una contra-estrategia aumente las posibilidades de ganar. Ese acercamiento está bien para lo finito, pero cuando el espacio de todas los movimientos posibles aumenta en juegos complejo, se vuelve insostenible.
Es por eso que la derrota del campeón mundial de Go, Lee Sedol, por DeepMind de AlphaGo, fue una gran ocurrencia. Para ese entonces, los expertos no esperaban que una IA venciera a los mejores jugadores por lo menos por una década. ALphaGo mostró el sorprendente poder del aprendizaje profundo comparado con "la vieja confiable IA."
Pero el aprendizaje profundo tiene sus desventajas. Una de ellas es que es una "caja negra". Cómo los millones de nodes en una red neuronal logran una tarea es un misterio.
El movimiento 37 de AlphaGo contra Lee Sedol fue una decisión que ningún humano tomaría, calculó la probabilidad de que un profesional hubiera hecho ese movimiento en 1 en 10,000; pero de todos modos lo hizo y ganó. Aún así, el algoritmo no pudo explicar qué parte de su entrenamiento le dio confianza. Esta opacidad es un problema cuando los riesgos son más altos que un juego de mesa. Para confiar en autos autónomos o algoritmos médicos que tomen decisiones o diagnósticos de vida o muerte, necesitamos entender su razonamiento.
Nuestra solución potencial, soportada por investigadores como NukkAI, mezclaría aprendizaje profundo con simbólico, explotando las fortalezas de cada uno en lo que se llama un acercamiento "neurosimbólico".
NooK, por ejemplo, aprende las reglas del juego primero, luegos mejora sus habilidades al jugar. La combinación refina el "cerebro" probabilístico del algoritmo, Muggleton le dijo a El Telégrafo, yendo mas allá de la estadística. NooK, dijo, usa "conocimiento de segundo plano de forma similar a cómo aumentamos nuestra propio aprendizaje con información de libros y experiencias previas." COmo resultado, el algoritmo puede explicar sus decisiones: es una IA de "caja blanca".
Es por eso que el bridge, un juego de comunicación y estrategia que se ha resistido a ser conquistado por la IA, es una gran prueba para este acercamiento. "En el bridge, no puedes jugar si no explicas," dijo al El Guardián Véronique Ventos, cofundadora de NukkAI.
Hay algoritmos para jugar bridge, pero no pueden competir con los mejores humanos. En la competencia en París de NukkAI, parece que la situación ha cambiado.
El reto NukkAI puso a NooK contra ocho campiones mundiales de bridge.
Cada campeón jugó diez rondas de diez juegos, mientras que NooK jugó 80 rondas de 10 juegos, o 800 partidas seguidas. En lugar de jugar entre ellos, los humanos y la IA jugaron las mismas manos contra los mismos oponentes, un par de bots de bridge (no creados por NukkAI) llamados Wbridge5.
Un juego de bridge comienza con los jugadores apostando sobre cuantos trucos, o rondas de juego, pueden ganar. La apuesta mas alta es llamada el contrato, y cualquiera que defina el contracto es el declarante. El compañero del declarante, o el maniquí, pone su mano de cartas boca arriba en la mesa y sale del juego. El declarante ahora juega ambas manos en contra de sus oponentes, y trata de ganar suficientes trucos para alcanzar la apuesta.
El reto NukkAI removió las apuestas para simplificar el juego, y tanto los humanos como NooK asumieron el rol del declarante en cada juego, con el par de bots como oponentes (o defensores). La diferencia entre el puntaje de Nook y cada jugador humano fue promediado después de cada partida. NooK venció a sus rivales en 67, o 83 por ciento, de las 80 partidas jugadas.
"Es bastante desesperante para los humanos," dijo Thomas Bessis, campeón francés. "Hay momentos donde no entiendo porqué la IA está jugando mejor que nosotros, pero lo hace. Es muy frustrante".
La victoria de NooK es un logro impresionante, pero hay problemas. Saltarse la fase de apuesta y jugar solo como el declarante quita todas las partes retadoras y matizadas en la que los compañeros deben comunicarse con el otro y engañar a sus oponentes. También, es un reto para un humano el mantenerse concentrado por 100 partidas seguidas, pero no para una computadora. Finalmente, Jean-Baptiste Fantun, cofundador de NukkAI, dijo que estaba confiado en que la máquina prevalecería en miles de rondas, pero estaba menos entusiasmado acerca de su porvenir en solo 800. En otras palabras, entre más juega, mejores probabilidades de ganar, así que jugar muchas manos consecutivas podría haver ayudado a la IA desplazar a los humanos.
"Aún en el bridge, existen otras cosas para ser resueltas," dijo Fantun. "Todavía tenemos un plan de trabajo frente a nosotros." Eso es, es mucho decir que el bridge ha caído frente a la IA, como el ajedrez o el GO. Pero la IA obteniendo mejor puntaje que los mejores jugadores humanos en parte del juego es un logro muy importante en el plan de Fantun. Y mientras algoritmos aún mas grandes, como GPT-3 de OpenAI, continuan impresionando, el rendimiento de NukkAI en bridge puede agregar peso al argumento de un acercamiento híbrido.
En seguida, tendrán que mostrar que NooK puede jugar y ganar.
Fuentes
singularityhub.com
Comments