Facebook crée un algorithme qui joue au poker mieux qu’un humain
Une équipe de chercheurs de Facebook a développé un algorithme utilisant l’Intelligence Artificielle (IA) capable de jouer Poker heads-up Texas Hold’em sans limite mieux que les humains.
ReBeL est un système qui utilise des connaissances communes sur le poker pour prendre de meilleures décisions, en moins de temps, dans un environnement de jeu réel.
Ce projet s’appelle Recursive Belief-based Learning (ReBeL) et ses performances sont optimales en utilisant une plus petite quantité de connaissances, par rapport aux autres systèmes d’IA de poker existants. Par exemple, d’autres algorithmes utilisent une combinaison d’apprentissage par renforcement et une série de modèles de comportement. Cependant, des recherches menées par Facebook établissent que ce mélange de technologies minimise les performances dans des jeux comme le Poker où il fait des hypothèses qui ne sont pas en phase avec le monde réel, car dans un jeu réel la probabilité d’exécution des actions influence les jeux et les stratégie appliquée par le participant.
Avec ReBeL, Facebook cherche à améliorer cela en permettant à l’algorithme de fonctionner dans un jeu de poker plus réel, en utilisant les connaissances communes qu’il acquiert des autres participants, où la recherche de résultats s’effectue avec plus de simplicité et de flexibilité, ce qui augmente les possibilités de vaincre le meilleur joueur de poker du monde
ReBeL utilise ce qu’on appelle le « Public Belief State » (PBS) pour élargir les connaissances sur un jeu, ce qui permet à l’algorithme d’agir plus naturellement et avec certitude. Ce qu’il fait, c’est distribuer une série de probabilités de connaissance commune du poker à une table, basée sur une séquence limitée de réponses possibles à prendre. C’est-à-dire que le PBS devient un véritable jeu de poker, où les multiples options dont dispose un joueur au cours d’une partie sont prises en compte, comme parier plus, payer, retirer…
Ainsi les choses, ce que fait ReBeL est de créer un jeu miroir identique au jeu originalil. Avec le PBS, il génère différentes possibilités d’agir dans un jeu de poker et essaie d’anticiper les réponses possibles et de voir comment le jeu évoluerait compte tenu de chaque option. Tout cet apprentissage par renforcement ajoute à votre réserve de connaissances, créant un réseau de valeur.
ReBeL s’est mis à l’épreuve avec Don King, considéré comme le meilleur joueur de poker tête-à-tête no-limit Texas Hold’em. Dans ce match, 7 500 matchs ont été joués où ReBeL a pris entre deux et cinq secondes pour décider de leur coup dans chacun d’eux. De plus, lors des mises à l’aveugle qui se font par tour à chaque partie, ReBeL a obtenu 165 millièmes, un chiffre beaucoup plus élevé par rapport à Libratus, un autre système de poker créé par Facebook, qui dans la même situation atteignait 147 millièmes. En plus de ReBeL et Libratus, Facebook propose également Pluribus, un autre système qui a battu les joueurs de poker experts et qui a été développé il y a quelques années.
Pour le moment, la recherche Facebook ReBel a été publiée sans le code source, pour empêcher son utilisation sur d’autres plateformes et encourager la triche et l’utilisation abusive par les joueurs en ligne.