ACCUEIL | FLUX RSS
Dimanche 27 Mai 2018

TECHNOLOGIES - Publié le 21/10/2017 à 18:34


Nouveau succès au jeu de go pour l'intelligence artificielle



        
AlphaGo, le super-ordinateur qui avait fait sensation l'an dernier en battant le champion du monde de go, un jeu extraordinairement complexe, est tombé sur plus fort que lui: il vient d'être écrasé par une nouvelle version de ce programme, capable d'apprendre par lui-même, "en s'affranchissant de la connaissance humaine".

AlphaGo Zero, ce nouveau programme "plus puissant", victorieux sur le score sans appel de 100 à 0 , "est sans doute le plus fort joueur de go de l'histoire", estiment Demis Hassabis et David Silver, deux de ses concepteurs, selon une étude publiée mercredi dans la revue Nature.

Au jeu de go, le nombre de combinaisons possibles est astronomique, plus grand que le nombre d'atomes dans l'univers. Les programmes informatiques, bien que très forts en calcul, ne peuvent donc pas passer en revue toutes les possibilités pour choisir la bonne mais doivent imiter les concepts stratégiques de l'homme.

Pour battre en 2016 Lee Se-Dol, grand maître sud-coréen du jeu de go (par quatre parties à une), AlphaGo avait été nourri des milliers de parties jouées par des professionnels et des amateurs, lui permettant ainsi "d'apprendre", pendant plusieurs mois, à copier le raisonnement humain par l'apprentissage profond ("deep learning" en anglais).

AlphaGo Zero, également développé par le britannique DeepMind, une filiale de Google spécialisée dans l'intelligence artificielle, est pour sa part capable "d'apprendre tout seul à jouer au go", précise l'étude.

Pour s'entraîner, AlphaGo Zero joue contre lui-même, "en partant de 0" sans autre connaissance sur le go que les règles du jeu. Contrairement à AlphaGo, il n'a donc pas eu besoin de se confronter à des humains pour devenir imbattable.

"Après trois jours d'entraînement (presque 5 millions de parties, ndlr) en autodidacte, il a battu la version de 2016 d'AlphaGo", expliquent Demis Hassabis et David Silver sur un blog.

Toujours besoin des humains

Et alors qu'AlphaGo nécessitait plusieurs machines, son successeur fonctionne avec une seule.

"Ce n'est pas le premier logiciel qui apprend par lui-même, la nouveauté c'est que AlphaGo Zero soit si bon", souligne le futurologue Anders Sandberg de l'Université d'Oxford.

La victoire d'AlphaGo sur Lee Se-Dol l'an dernier avait fait sensation: c'était la première fois qu'un logiciel écrasait un joueur chevronné lors d'un match entier.

Cette victoire avait été saluée comme une percée technologique pour les ordinateurs, désormais capables non seulement de conduire des voitures mais aussi d'aider l'humanité à résoudre quelques-uns des problèmes scientifiques, techniques ou médicaux les plus ardus.

Déjà en 1997, le champion du monde d'échecs Garry Kasparov avait été vaincu par l'ordinateur Deep Blue d'IBM. Mais le défi pour la machine semblait bien plus relevé au jeu de go, dans lequel deux adversaires tentent d'occuper le plus d'espace sur un plateau quadrillé en plaçant alternativement des pierres noires et blanches.

Avec AlphaGo Zero, une nouvelle étape est franchie, dans la mesure où le logiciel, pour apprendre, n'est "plus contraint par les limites de la connaissance humaine", selon les concepteurs de DeepMind.

Dans certains domaines, les connaissances peuvent être difficiles à réunir voire inexistantes. Il est alors difficile de "nourrir" les logiciels d'exemples et de données pour leur permettre de s'entraîner. L'auto-apprentissage permet de sauter cette étape parfois difficile à mettre en place.

Mais si elle peut se passer avec succès de l'expérience humaine pour se perfectionner, la machine dépend néanmoins toujours de l'intelligence des hommes: "Les brillantes idées qui ont permis d'améliorer le programme ont été générées par l'homme", précise Anders Sandberg. "AlphaGo ne se programme pas tout seul !".

L'informatique quantique franchira un nouveau palier cette année, promet Bo Ewald
La blockchain fait rêver le secteur de la santé
Amazon exhorté à ne plus fournir son outil de reconnaissance faciale à la police
Les compétitions du jeu vidéo Fortnite dotées de 100 millions de dollars
Paris accueille cette semaine la fine fleur de la tech mondiale
Samsung vs Apple: combien valent les bords arrondis de l'iPhone?
A Bordeaux, une borne tactile pour renseigner et orienter les sans-abri
Jeux vidéo et Histoire: la lente remise en question du récit occidental
Lithium: le chinois Tianqi renforce sa position avec un deal géant au Chili
YouTube va lancer une nouvelle version de son service de musique en ligne
 Publicité 
 LES PLUS RÉCENTS 
Climat: moins de neige et la belette blanche devient une cible
Un château en Corrèze pour un peu plus de 11 euros et la bonne cause
Alzheimer: vers un possible déremboursement des médicaments
En Afrique du Sud, mariage astronomique inédit pour mieux scruter l'univers
Dans le sud du Maroc, les météorites suscitent les convoitises
 LES PLUS LUS 
VIDEO: Des images rares du requin du Groenland dans les eaux de l’Arctique
Les scientifiques américains transfèrent la mémoire d'un escargot à l'autre en transplantant de l'ARN
VIDEO: Une famille pourchassée par des guépards dans un parc animalier
SpaceX lance avec succès sa plus puissante fusée Falcon 9
Bonheur : votre humeur dépend de ce que vous mangez
Luxembourg: derrière la prospérité, la salle de shoot
Le régime alimentaire à base de produits d'origine animal émet 197,65 kg de CO2 par an et par habitant en France
L'Australie promet des millions d'euros pour aider ses koalas
Lire à haute voix est la meilleure méthode pour améliorer sa mémoire à long terme
Près d’un tiers des hommes auraient préféré ne pas être présents lors de la naissance de leur bébé
 Publicité 
 En image 
 Publicité 
2011-2018 © Aux Frontières de la Science. Crédits photos: istockphoto. Page générée en 0.037 secondes. Blog d'actualités scientifiques réalisé par des passionnés.