Trente nevrale nett fungerer omtrent som mennesker på klassiske psykologiske tester

Ms. Tech

På begynnelsen av 1900-tallet begynte en gruppe tyske eksperimentelle psykologer å stille spørsmål ved hvordan hjernen får meningsfulle oppfatninger av en verden som ellers er kaotisk og uforutsigbar. For å svare på dette spørsmålet utviklet de forestillingen om gestalteffekten – ideen om at når det kommer til persepsjon, er helheten noe annet enn delene.

På samme måte har psykologer oppdaget at den menneskelige hjernen er bemerkelsesverdig god til å oppfatte fullstendige bilder på grunnlag av fragmentarisk informasjon. Et godt eksempel er figuren som vises her. Hjernen oppfatter todimensjonale former som en trekant og en firkant, og til og med en tredimensjonal kule. Men ingen av disse formene er eksplisitt tegnet. I stedet fyller hjernen hullene.



En naturlig utvidelse av dette arbeidet er å spørre om gestalteffekter forekommer i nevrale nettverk. Disse nettverkene er inspirert av den menneskelige hjernen. Forskere som studerer maskinsyn sier faktisk at de dype nevrale nettverkene de har utviklet viser seg å være bemerkelsesverdig lik det visuelle systemet i primats hjerner og deler av den menneskelige cortex.

Det fører til et interessant spørsmål: kan nevrale nettverk oppfatte et helt objekt ved å se bare på delene, slik mennesker gjør?

I dag får vi svar takket være arbeidet til Been Kim og kolleger ved Google Brain, selskapets AI-forskningsavdeling i Mountain View, California. Forskerne har testet ulike nevrale nettverk ved å bruke de samme gestalteksperimentene designet for mennesker. Og de sier de har gode bevis på at maskiner faktisk kan oppfatte hele objekter ved å bruke observasjoner av delene.

hva som vil skje når nettnøytraliteten er borte

Kim og cos eksperiment er basert på trekantillusjonen vist i figuren. De oppretter først tre databaser med bilder for å trene deres nevrale nettverk. Den første består av vanlige komplette trekanter som vises i sin helhet.

Den neste databasen viser bare hjørnene på trekantene, med linjer som må interpoleres for å oppfatte hele formen. Dette er det illusoriske datasettet. Når mennesker ser på denne typen bilder, har de en tendens til å lukke hullene og ende opp med å oppfatte trekanten som en helhet. Vi tar sikte på å finne ut om nevrale nettverk viser lignende lukkeeffekter, sier Kim og co.

Den endelige databasen består av lignende hjørner, men tilfeldig orientert slik at linjene ikke kan interpoleres for å danne trekanter. Dette er det ikke-illusoriske datasettet.

Ved å variere størrelsen og orienteringen til disse formene, laget teamet nesten 1000 forskjellige bilder for å trene maskinene deres.

Deres tilnærming er å trene et nevralt nettverk til å gjenkjenne vanlige komplette trekanter og deretter teste om det klassifiserer bildene i det illusoriske datasettet som komplette trekanter (mens man ignorerer bildene i det ikke-illusoriske datasettet). De tester med andre ord om maskinen kan fylle ut hullene i bildene for å danne et helhetlig bilde.

De sammenligner også oppførselen til et trent nettverk med oppførselen til et utrent nettverk eller et som er trent på tilfeldige data.

Resultatene gir interessant lesning. Det viser seg at oppførselen til trente nevrale nettverk viser bemerkelsesverdige likheter med menneskelige gestalteffekter. Våre funn tyder på at nevrale nettverk trent med naturlige bilder viser lukking, i motsetning til nettverk med randomiserte vekter eller nettverk som har blitt trent på visuelt tilfeldige data, sier Kim og co.

Det er et fascinerende resultat. Og ikke bare fordi det viser hvordan nevrale nettverk etterligner hjernen for å forstå verden.

menneskelige organer hos griser

Det større bildet er at teamets tilnærming åpner døren til en helt ny måte å studere nevrale nettverk ved å bruke verktøyene til eksperimentell psykologi. Vi tror at å utforske andre gestaltlover – og mer generelt andre psykofysiske fenomener – i sammenheng med nevrale nettverk er et lovende område for fremtidig forskning, sier Kim og co.

Det ser ut som et første skritt inn i et nytt felt innen maskinpsykologi. Som Google-teamet sa det: Å forstå hvor mennesker og nevrale nettverk er forskjellige, vil være nyttig for forskning på tolkbarhet ved å belyse de grunnleggende forskjellene mellom de to interessante artene. De tyske eksperimentelle psykologene fra begynnelsen av 1900-tallet ville sikkert vært fascinert.

Ref: arxiv.org/abs/1903.01069 : Viser nevrale nettverk gestaltfenomener? En utforskning av loven om nedleggelse

gjemme seg