Informasjonsteori avslører størrelsen på hval- og delfinkommunikasjonsrepertoarer

En av 1900-tallets store helter innen fysikk er Claude Shannon som mer eller mindre egenhendig oppfant informasjonsteori på 1940-tallet. Shannon brukte teorien sin til å finne ut de grunnleggende grensene for hvor mye vi kan komprimere data, samt hvor pålitelig vi kan lagre og sende dem.

Shannon begynte umiddelbart å bruke teorien sin for å studere informasjonsinnholdet i det engelske språket. En tilnærming var å bruke frivillige til å gjette de manglende bokstavene i ord for å finne informasjonsinnholdet deres. Fra denne studien hans av størrelsen og antallet ofte brukte ord, var Shannon i stand til å måle kompleksiteten til menneskelig språk.

I dag foreslår Reginald Smith, en uavhengig forsker ved Citizen Scientists League i Rochester, New York, en interessant ny måte å analysere dyrekommunikasjon på. Hans tilnærming er å ta Shannons tilnærming omvendt – for å starte med et mål på kompleksiteten til språket og bruke det til å finne ut størrelsen og antallet av de forskjellige ordene det inneholder. Resultatet er et interessant anslag over repertoarene som ulike dyr bruker for å kommunisere.



Tilbake på 1940-tallet revolusjonerte Shannon studiet av informasjon. Spesielt så han på betinget entropi, mengden informasjon som en enkelt bokstav formidler når den følger etter en annen bokstav eller rekkefølge av bokstaver.

For det engelske alfabetet på 26 bokstaver pluss mellomrom, beregnet Shannon at en enkelt bokstav formidler litt over fire biter med informasjon når den følger en annen enkelt bokstav. For en bokstav som følger en sekvens på to bokstaver, er entropien 3,56 biter og for en bokstav som følger en sekvens på 3 bokstaver, er den 3,3 biter. Disse verdiene er kjent som første, andre og tredje ordens entropier.

Denne oppdagelsen hadde en dyp effekt på biologer som var enormt nysgjerrige på informasjonsinnholdet i dyrekommunikasjon. Siden den gang har mange grupper registrert ulike typer dyrekommunikasjon og beregnet informasjonsinnholdet.

Resultatene viser tydelig at dyrekommunikasjon innebærer betydelige mengder informasjon. For eksempel er informasjonsentropien til biedanser 2,54 biter.

Imidlertid er kompleksiteten i dyrekommunikasjon ikke så tydelig. Generelt avhenger kompleksiteten av avhengighetsrekkefølgen. For eksempel viser mange fuglekallsekvenser et høyt informasjonsinnhold for førsteordens avhengighet, men informasjonsinnholdet synker betydelig når det gjelder andre og tredjeordens avhengigheter.

Det ser ut til å tyde på at kompleksiteten i fugleanropskommunikasjon er relativt lav. Smith påpeker imidlertid at resultatene er svært sensitive for størrelsen på fuglerepertoarene. Dette er helt klart et problem når det bare er en liten mengde eksperimentelle data å jobbe med.

For eksempel, hvis fugler har et stort repertoar med forskjellige 2-bokstavs- og 3-bokstavsord, krever en skikkelig analyse et betydelig større utvalg av fuglekall enn hvis repertoaret er lite.

hvorfor vi ikke bør bryte opp stor teknologi

Så et viktig spørsmål er hvor store disse dyrerepertoarene er.

Smiths nye innsikt er at det er en annen måte å regne ut størrelsen på repertoaret av forskjellige ordlengder. Han påpeker at førsteordens entropien til et språk er nært knyttet til det nøyaktige antallet mulige ordlengdekombinasjoner.

Så gitt et mål på førsteordens entropien til et språk, er det mulig å bruke denne kombinatoriske metoden for å regne ut det sannsynlige repertoaret med forskjellige ordlengder.

Smith bruker denne innsikten til å undersøke dataene som er samlet inn for flere forskjellige typer dyr, som flaskenesedelfiner, knølhval og ulike typer stær, trost og skylerk. For hver art beregner han maksimalt og minimumsrepertoar av 1-bokstaver, 2-bokstaver og 3-bokstaver som vises i dataene.

Resultatene gir interessant lesning. Smith beregner at flaskenesedelfiner har et repertoar på 27 enkeltbokstaver, fem stavelser på 2 bokstaver og fire eller fem stavelser på 3 bokstaver. Derimot har knølhvaler et repertoar på bare seks enkeltbokstaver, men bruker sytten eller atten tobokstavsstavelser (dataene er ikke omfattende nok til å avsløre repertoaret med trebokstavsstavelser).

Fuglene ser ut til å ha mye større ordforråd. Europeiske stær, for eksempel, bruker over 100 enkeltbokstaver, men kan bruke så mange som 78 stavelser på tre bokstaver eller så få som 6.

Smiths kanskje viktigste funn er at mengden informasjon han er i stand til å trekke ut om repertoarene er alvorlig begrenset av størrelsen på datasettene og at det trengs mer arbeid for å utvide dem. Til syvende og sist er den beste måten å nøyaktig måle repertoarstørrelsene på, spesielt for delfiner og knølhval, å gjøre en mye større måling av sekvenser, avslutter han.

Det er interessant arbeid. Selv om den ikke kan avsløre hensikten eller mulige betydningen av disse dyrekommunikasjonene, avslører den absolutt noe av kompleksiteten.

mest populære filtre på instagram

Og Smith har store forventninger til fremtiden hvis det kan samles inn mer data. Det er forfatterens håp at informasjonsteoretiske analyser kan bidra til å trekke tilbake lagene av kompleksitet for å vise hvor nært slik dyrekommunikasjon samsvarer med – eller er forskjellig fra – menneskelig språk, sier han.

Ref: arxiv.org/abs/1308.3616 : Kompleksitet i dyrekommunikasjon: Estimering av størrelsen på N-Gram-strukturer

gjemme seg