Général

Un système d'IA s'est appris à résoudre le Rubik's Cube en seulement 44 heures

Un système d'IA s'est appris à résoudre le Rubik's Cube en seulement 44 heures



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Un système d'intelligence artificielle (IA) autodidacte appelé DeepCube a maîtrisé la résolution du puzzle Rubik's Cube en seulement 44 heures sans intervention humaine. Les inventeurs du système ont détaillé leur conception dans un article intitulé «Résoudre le cube de Rubik sans connaissance humaine».

«Un agent généralement intelligent doit être capable de s’apprendre à résoudre des problèmes dans des domaines complexes avec un minimum de supervision humaine», écrivent les auteurs de l’article. «En effet, si nous voulons un jour parvenir à une intelligence artificielle générale et humaine, nous devrons développer des systèmes capables d'apprendre, puis appliquer ces apprentissages à des applications du monde réel.»

Le Rubik's Cube s'est avéré plus difficile que le go ou les échecs

Alors que de nombreux systèmes d'IA ont appris à jouer à des jeux, maîtriser la complexité d'un Rubik's Cube posait un ensemble unique de défis. L'enseignement de jeux comme le go et les échecs se fait généralement en apprenant une stratégie qui enseigne les «bons» et «mauvais» mouvements et récompense la prise de décision positive.

Cependant, ce type d'apprentissage ne fonctionne pas avec la résolution du Rubik's Cube car il est difficile de déterminer si un seul mouvement a accéléré le puzzle vers la solution. Si le système ne peut pas être récompensé pour des étapes supplémentaires, il ne peut pas apprendre.

Un Rubik’s Cube 3X3X3 a un «espace d’états» total de 43 252 003 274 489 856 000 combinaisons (soit 43 quintillions). Pour résoudre le puzzle, les six côtés du cube doivent être de la même couleur.

Pour arriver à ce moment magique, il existe une multitude d'algorithmes ou de stratégies, dont le premier a mis plusieurs mois à l'inventeur du puzzle Ernő Rubik. Le minimum de mouvements possibles pour déchiffrer le jeu frustrant a été déterminé à 26.

Depuis l'invention du jeu, nous avons développé de nombreuses façons de résoudre le puzzle et les fans du jouet sont impatients de les partager avec les nouveaux arrivants. Cependant, les chercheurs étaient déterminés à trouver un moyen d'apprendre au système à résoudre le casse-tête sans lui donner accès à ces connaissances préalables et à cette liste de conseils.

Nouvelle technique d'IA développée

Pour résoudre le problème d'apprentissage, l'équipe de recherche de l'Université de Californie à Irvine a développé une nouvelle technique d'IA connue sous le nom d'itération autodidactique. «Afin de résoudre le Rubik’s Cube en utilisant l’apprentissage par renforcement, l’algorithme apprendra une politique», écrivent les chercheurs dans leur étude.

«La politique détermine le mouvement à adopter dans un état donné.» Pour créer cette politique, DeepCube a développé son propre système de récompense et, en utilisant uniquement les modifications du cube, a appris à évaluer le succès possible de ses mouvements proposés. Il le fait d'une manière super intelligente mais incroyablement longue (pour de simples humains au moins).

Lorsque DeepCube décide d'un mouvement, il saute complètement vers le cube terminé, puis revient à son ajustement proposé. Ce système permet à DeepCube d'évaluer le succès global du déménagement.

Une fois qu'il a collecté suffisamment de données, il utilise ensuite une méthode de recherche arborescente pour examiner tous les mouvements de recherche possibles avant de décider du chemin à emprunter. «Notre algorithme est capable de résoudre 100% des cubes brouillés aléatoirement tout en atteignant une longueur de résolution médiane de 30 coups, inférieure ou égale aux solveurs qui utilisent la connaissance du domaine humain», écrivent les chercheurs.

Les chercheurs relèveront bientôt le défi et testeront la nouvelle technique d'itération autodidactique sur des cubes plus durs à 16 faces.


Voir la vidéo: Tutoriel - Résoudre le Rubiks Cube solution complète pour débutants (Août 2022).