DeepMinds AI har nå utkonkurrert nesten alle menneskelige spillere på StarCraft II

AlphaStar (Zerg, i rødt) forsvarer en tidlig aggresjon der motstanderen bygde en del av basen nær AlphaStar

AlphaStar (Zerg, i rødt) forsvarer en tidlig aggresjon der motstanderen bygde en del av basen nær AlphaStars base.med tillatelse fra DeepMind

I januar i år kunngjorde DeepMind at de hadde nådd en milepæl i sin søken etter kunstig generell intelligens. Den hadde designet et AI-system, kalt AlphaStar, som slo to profesjonelle spillere på StarCraft II, et populært videospill om galaktisk krigføring. Dette var litt av en bragd. StarCaft II er svært kompleks, med 1026 valg for hver bevegelse. Det er også et spill med ufullkommen informasjon – og det er ingen definitive strategier for å vinne. Prestasjonen markerte et nytt nivå av maskinintelligens.

Nå slipper DeepMind, et datterselskap av Alphabet, en oppdatering. AlphaStar overgår nå det store flertallet av aktive StarCraft-spillere, og viser en mye mer robust og repeterbar evne til å legge strategier på farten enn før. Resultatene, publisert i Nature i dag, kan ha viktige implikasjoner for applikasjoner som spenner fra maskinoversettelse til digitale assistenter eller til og med militær planlegging.



StarCraft II er et sanntids strategispill, som oftest spilles én mot én. En spiller må velge en av tre menneskelige eller fremmede raser – Protoss, Terran eller Zerg – og veksle mellom å samle ressurser, bygge infrastruktur og våpen og angripe motstanderen for å vinne spillet. Hvert løp har unike ferdighetssett og begrensninger som påvirker vinnerstrategien, så spillere velger og mestrer å spille med en.

AlphaStar brukte forsterkningslæring, der en algoritme lærer gjennom prøving og feiling, for å mestre å leke med alle rasene. Dette er veldig viktig fordi det betyr at samme type metoder i prinsippet kan brukes på andre domener, sa David Silver, DeepMinds viktigste forsker, på en pressesamtale. AI nådde også en rangering over 99,8 % av de aktive spillerne i den offisielle online-ligaen.

AlphaStar håndterer flygende enheter fra Zerg-spillerne med en kombinasjon av kraftige luftvernenheter.

AlphaStar, spiller som Protoss (i grønt), motvirker et angrep fra en Zerg-spiller. med tillatelse fra DeepMind

For å oppnå en slik fleksibilitet, modifiserte DeepMind-teamet en ofte brukt teknikk kjent som selvspill, der en forsterkningslæringsalgoritme spiller mot seg selv for å lære raskere. DeepMind brukte denne teknikken som kjent for å trene AlphaGo Zero , programmet som lærte seg selv uten menneskelig innspill for å slå de beste spillerne i det eldgamle spillet Go. Laboratoriet brukte det også i den foreløpige versjonen av AlphaStar.

Konvensjonelt i selvspill er begge versjoner av algoritmen programmert for å maksimere sjansene for å vinne. Men forskerne oppdaget at det ikke nødvendigvis resulterte i de mest robuste algoritmene. For et slikt åpent spill risikerte det å legge algoritmen inn i spesifikke strategier som bare ville fungere under visse forhold.

Med inspirasjon fra måten profesjonelle StarCraft II-spillere trener med hverandre, programmerte forskerne i stedet en av algoritmene til å avsløre feilene til den andre i stedet for å maksimere sin egen sjanse til å vinne. Det er på en måte [som] å be en venn om å spille mot deg, sa Oriol Vinyals, hovedforskeren på prosjektet, under samtalen. Disse vennene bør vise deg hva dine svakheter er, så etter hvert kan du bli sterkere. Metoden produserte mye mer generaliserbare algoritmer som kunne tilpasse seg et bredere spekter av spillscenarier.

Forskerne mener at AlphaStars strategiutvikling og koordineringsferdigheter kan brukes på mange andre problemer. Vi valgte StarCraft [...] fordi vi følte det speilet mange utfordringer som faktisk dukker opp i virkelige applikasjoner, sa Silver. Disse applikasjonene kan inkludere digitale assistenter, selvkjørende biler eller andre maskiner som må samhandle med mennesker, sa han.

Kompleksiteten [til StarCraft] minner mye mer om skalaene vi ser i den virkelige verden, sa Silver.

Men AlphaStar demonstrerer også AIs betydelige begrensninger. For eksempel trenger den fortsatt størrelsesorden mer treningsdata enn en menneskelig spiller for å oppnå samme ferdighetsnivå. Slik læringsprogramvare er også langt unna å bli oversatt til sofistikert robotikk eller virkelige applikasjoner.

For å få flere historier som dette levert direkte til innboksen din, meld deg på vårt Webby-nominerte AI-nyhetsbrev The Algorithm. Det er gratis.

gjemme seg

Faktiske Teknologier

Kategori

Ukategorisert

Teknologi

Bioteknologi

Teknisk Politikk

Klima Forandringer

Mennesker Og Teknologi

Silicon Valley

Databehandling

Mit News Magazine

Kunstig Intelligens

Rom

Smarte Byer

Blockchain

Feature Story

Alumniprofil

Alumniforbindelse

Mit News-Funksjon

1865

Mitt Syn

77 Mass Ave

Møt Forfatteren

Profiler I Generøsitet

Sett På Campus

Alumnibrev

Nyheter

Valget 2020

Med Indeks

Under Kuppelen

Brannslange

Uendelige Historier

Pandemisk Teknologiprosjekt

Fra Presidenten

Forsidehistorie

Fotogalleri

Anbefalt