Nevral koding - Neural coding

Nevral koding (eller nevral representasjon ) er et nevrovitenskapelig felt som er opptatt av å karakterisere det hypotetiske forholdet mellom stimulansen og individuelle eller ensemble neuronale responser og forholdet mellom den elektriske aktiviteten til nevronene i ensemblet. Basert på teorien om at sensorisk og annen informasjon er representert i hjernen av nettverk av nevroner , antas det at nevroner kan kode både digital og analog informasjon.

Oversikt

Nevroner er bemerkelsesverdige blant cellene i kroppen i deres evne til å spre signaler raskt over store avstander. De gjør dette ved å generere karakteristiske elektriske pulser som kalles handlingspotensialer : spenningsspiker som kan bevege seg nedover aksoner. Sensoriske nevroner endrer aktivitetene sine ved å skyte sekvenser av handlingspotensialer i forskjellige tidsmønstre, med tilstedeværelse av eksterne sensoriske stimuli, for eksempel lys , lyd , smak , lukt og berøring . Det er kjent at informasjon om stimulansen er kodet i dette mønsteret av handlingspotensialer og overført til og rundt hjernen, men dette er ikke den eneste metoden. Spesialiserte nevroner, for eksempel netthinnen, kan kommunisere mer informasjon gjennom graderte potensialer . Dette skiller seg fra handlingspotensialer fordi informasjon om styrken til en stimulus direkte korrelerer med styrken til nevronproduksjonen. Signalet forfaller mye raskere for graderte potensialer, noe som krever korte avstander mellom nevroner og høy nevronell tetthet. Fordelen med graderte potensialer er høyere informasjonshastigheter som er i stand til å kode flere tilstander (dvs. høyere troskap) enn å spike nevroner.

Selv om handlingspotensialer kan variere noe i varighet, amplitude og form, blir de vanligvis behandlet som identiske stereotype hendelser i nevrale kodingsstudier. Hvis den korte varigheten av et handlingspotensial (ca. 1 ms) ignoreres, kan en handlingspotensiell sekvens eller piggetog bare karakteriseres av en rekke alt-eller-ingen- punkt hendelser i tid. Lengden på interspike -intervaller ( ISI -er ) mellom to påfølgende pigger i et piggetog varierer ofte, tilsynelatende tilfeldig. Studiet av nevral koding innebærer å måle og karakterisere hvordan stimulusattributter, for eksempel lys- eller lydintensitet, eller motoriske handlinger, for eksempel retningen til en armbevegelse, er representert av nevronhandlingspotensialer eller pigger. For å beskrive og analysere neuronal avfyring, statistiske metoder og fremgangsmåter for sannsynlighetsteori og stokastiske punkt prosesser har blitt mye brukt.

Med utviklingen av storskala nevrale opptaks- og dekodingsteknologier, har forskere begynt å knekke nevrale koder og har allerede gitt det første innblikk i nevrale koden i sanntid etter hvert som minnet dannes og tilbakekalles i hippocampus, en hjerneområde kjent for være sentral for minnedannelse. Nevrovitere har igangsatt flere store dekodingsprosjekter for hjerner.

Koding og dekoding

Koblingen mellom stimulans og respons kan studeres fra to motsatte synspunkter. Nevral koding refererer til kartet fra stimulans til respons. Hovedfokuset er å forstå hvordan nevroner reagerer på et stort utvalg av stimuli, og å konstruere modeller som prøver å forutsi svar på andre stimuli. Nevral dekoding refererer til det motsatte kartet, fra respons på stimulans, og utfordringen er å rekonstruere en stimulus, eller visse aspekter av den stimulansen, fra piggsekvensene den fremkaller.

Hypotetiserte kodingsordninger

En sekvens, eller "tog", av pigger kan inneholde informasjon basert på forskjellige kodingsordninger. I motoriske nevroner, for eksempel, avhenger styrken av en innervert muskel som trekkes sammen utelukkende av "avfyringshastigheten", gjennomsnittlig antall pigger per tidsenhet (en "hastighetskode"). I den andre enden er en kompleks " tidsmessig kode " basert på den nøyaktige timingen for enkeltpiksler. De kan være låst for en ekstern stimulans, for eksempel i det visuelle og auditive systemet, eller genereres iboende av de nevrale kretsene.

Hvorvidt nevroner bruker hastighetskoding eller tidsmessig koding er et tema for intens debatt i nevrovitenskapssamfunnet, selv om det ikke er noen klar definisjon av hva disse begrepene betyr.

Vurder koding

Hastighetskodingsmodellen for neuronal avfyringskommunikasjon sier at etter hvert som intensiteten til en stimulus øker, øker frekvensen eller frekvensen av handlingspotensialer , eller "piggfyring". Hastighetskoding kalles noen ganger frekvenskoding.

Hastighetskoding er et tradisjonelt kodingsopplegg, forutsatt at mest, om ikke alt, informasjon om stimulansen er inneholdt i avfyringshastigheten til nevronet. Fordi sekvensen av handlingspotensialer generert av en gitt stimulus varierer fra prøve til forsøk, blir neuronale responser vanligvis behandlet statistisk eller sannsynlig. De kan være preget av avfyringshastigheter, i stedet for som spesifikke piggsekvenser. I de fleste sensoriske systemer øker avfyringshastigheten, generelt ikke-lineært, med økende stimulusintensitet. Under en antakelse om hastighetskoding ignoreres all informasjon som muligens er kodet i den tidlige strukturen til piggetoget. Følgelig er frekvensen koding ineffektiv, men svært robust med hensyn til ISI ' støy '.

Under hastighetskoding er nøyaktig beregning av avfyringshastighet svært viktig. Faktisk har begrepet "avfyringshastighet" noen få forskjellige definisjoner, som refererer til forskjellige gjennomsnittsprosedyrer, for eksempel et gjennomsnitt over tid (hastighet som en enkelt-neuron piggtelling) eller et gjennomsnitt over flere repetisjoner (hastighet av PSTH) av eksperiment.

I hastighetskoding er læring basert på aktivitetsavhengige synaptiske vektendringer.

Hastighetskoding ble opprinnelig vist av ED Adrian og Y Zotterman i 1926. I dette enkle eksperimentet ble forskjellige vekter hengt fra en muskel . Etter hvert som stimulusens vekt økte, økte også antall pigger registrert fra sensoriske nerver som innerverer muskelen. Fra disse originale eksperimentene konkluderte Adrian og Zotterman med at handlingspotensialer var enhetlige hendelser, og at hendelsesfrekvensen, og ikke individuell hendelsesstørrelse, var grunnlaget for mest inter-neuronal kommunikasjon.

I de følgende tiårene ble måling av avfyringshastigheter et standardverktøy for å beskrive egenskapene til alle typer sensoriske eller kortikale nevroner, delvis på grunn av den relative lette måling av hastigheter eksperimentelt. Imidlertid forsømmer denne tilnærmingen all informasjon som muligens finnes i den nøyaktige tidspunktet for piggene. I løpet av de siste årene har flere og flere eksperimentelle bevis antydet at et enkelt skuddhastighetskonsept basert på tidsmessig gjennomsnitt kan være for forenklet til å beskrive hjerneaktivitet.

Spike-count rate (gjennomsnitt over tid)

Spike-count-frekvensen, også referert til som tidsmessig gjennomsnitt, oppnås ved å telle antall pigger som vises under en prøve og dividere med varigheten av prøveperioden. Lengden T på tidsvinduet er angitt av eksperimentatoren og avhenger av typen nevron registrert fra og til stimulansen. I praksis, for å få fornuftige gjennomsnitt, bør flere pigger oppstå i tidsvinduet. Typiske verdier er T = 100 ms eller T = 500 ms, men varigheten kan også være lengre eller kortere. ( Kapittel 1.5 i læreboken 'Spiking Neuron Models')

Spike-count-frekvensen kan bestemmes ut fra en enkelt prøve, men på bekostning av å miste all tidsoppløsning om variasjoner i nevral respons i løpet av forsøket. Midlertidig gjennomsnitt kan fungere godt i tilfeller der stimulansen er konstant eller sakte varierende og ikke krever en rask reaksjon av organismen - og dette er situasjonen som vanligvis oppstår i eksperimentelle protokoller. Inndata fra den virkelige verden er imidlertid neppe stasjonært, men endres ofte på en rask tidsskala. For eksempel, selv når man ser på et statisk bilde, utfører mennesker saccades , raske endringer i blikkretningen . Bildet som projiseres på retinalfotoreseptorene endres derfor hvert par hundre millisekunder ( kapittel 1.5 in)

Til tross for sine mangler, er konseptet med en spike-count rate-kode mye brukt ikke bare i eksperimenter, men også i modeller av nevrale nettverk . Det har ført til ideen om at et nevron forvandler informasjon om en enkelt inngangsvariabel (stimulusstyrken) til en enkelt kontinuerlig utgangsvariabel (avfyringshastigheten).

Det er et økende bevis på at i Purkinje-nevroner i det minste er informasjon ikke bare kodet i avfyring, men også i tidspunktet og varigheten av ikke-avfyrende, hvilende perioder. Det er også bevis fra netthinneceller, at informasjon ikke bare er kodet i avfyringshastigheten, men også i piggetidspunktet. Mer generelt, når en rask respons fra en organisme er nødvendig, er en avfyringshastighet definert som en økning i antall hundre millisekunder ganske enkelt for langsom.

Tidsavhengig skytehastighet (gjennomsnitt over flere forsøk)

Den tidsavhengige avfyringshastigheten er definert som gjennomsnittlig antall pigger (gjennomsnitt over forsøk) som vises i løpet av et kort intervall mellom tidene t og t+Δt, delt på varigheten av intervallet. Det fungerer for stasjonære så vel som for tidsavhengige stimuli. For å eksperimentelt måle den tidsavhengige avfyringshastigheten, registrerer eksperimentatoren fra et nevron mens han stimulerer med noen inngangssekvenser. Den samme stimuleringssekvensen gjentas flere ganger, og den neuronale responsen rapporteres i et Peri-Stimulus-Time Histogram (PSTH). Tiden t måles med hensyn til starten av stimuleringssekvensen. Δt må være stor nok (vanligvis i området ett eller noen få millisekunder) slik at det er et tilstrekkelig antall pigger innenfor intervallet for å oppnå et pålitelig estimat av gjennomsnittet. Antall forekomster av pigger n K (t; t+Δt) summeret over alle repetisjoner av eksperimentet delt med antall K repetisjoner er et mål på den typiske aktiviteten til nevronet mellom tid t og t+At. En ytterligere divisjon med intervalllengden Δt gir tidsavhengig avfyringshastighet r (t) til nevronet, som tilsvarer piggetettheten til PSTH ( kapittel 1.5 in).

For tilstrekkelig liten Δt er r (t) Δt gjennomsnittlig antall pigger som oppstår mellom tidene t og t+Δt over flere forsøk. Hvis Δt er liten, vil det aldri være mer enn en pigg innenfor intervallet mellom t og t+Δt på en gitt prøve. Dette betyr at r (t) Δt også er brøkdelen av forsøkene som en økning skjedde mellom disse tidene. Tilsvarende er r (t) Δt sannsynligheten for at en pigg oppstår i løpet av dette tidsintervallet.

Som en eksperimentell prosedyre er det tidsavhengige avfyringshastighetsmålet en nyttig metode for å evaluere nevronaktivitet, spesielt når det gjelder tidsavhengige stimuli. Det åpenbare problemet med denne tilnærmingen er at det ikke kan være kodingsopplegget som brukes av nevroner i hjernen. Nevroner kan ikke vente på at stimuliene gjentatte ganger presenteres på nøyaktig samme måte før de genererer et svar.

Likevel kan det eksperimentelle tidsavhengige avfyringshastighetsmålet være fornuftig, hvis det er store populasjoner av uavhengige nevroner som mottar den samme stimulansen. I stedet for å registrere fra en populasjon av N nevroner i et enkelt løp, er det eksperimentelt lettere å registrere fra et enkelt nevron og gjennomsnittlig over N gjentatte løp. Dermed er den tidsavhengige avfyringshastighetskodingen avhengig av den implisitte antagelsen om at det alltid er populasjoner av nevroner.

Midlertidig koding

Når nøyaktige timing pigg eller høy-frekvens fyringsintensitetssvingninger er funnet å bære informasjon, blir det nevrale koden ofte identifisert som en temporal kode. En rekke studier har funnet ut at den tidsmessige oppløsningen til nevrale koden er på en tidsskala på millisekunder, noe som indikerer at presis piggetid er et vesentlig element i nevral koding. Slike koder, som kommuniserer via tiden mellom pigger, blir også referert til som interpulsintervallkoder, og har blitt støttet av nyere studier.

Nevroner viser høyfrekvente svingninger i avfyringshastigheter som kan være støy eller kunne bære informasjon. Rate -kodingsmodeller antyder at disse uregelmessighetene er støy, mens tidsmessige kodingsmodeller antyder at de koder informasjon. Hvis nervesystemet bare brukte hastighetskoder for å formidle informasjon, ville en mer konsekvent, vanlig avfyringshastighet ha vært evolusjonært fordelaktig, og nevroner ville ha benyttet denne koden fremfor andre mindre robuste alternativer. Midlertidig koding gir en alternativ forklaring på "støyen", noe som tyder på at den faktisk koder informasjon og påvirker nevral behandling. For å modellere denne ideen kan binære symboler brukes til å markere piggene: 1 for en pigg, 0 for ingen pigg. Temporal koding lar sekvensen 000111000111 bety noe annet enn 001100110011, selv om gjennomsnittlig avfyringshastighet er den samme for begge sekvensene, med 6 pigger/10 ms. Inntil nylig hadde forskere lagt størst vekt på hastighetskoding som forklaring på postsynaptisk potensielle mønstre. Imidlertid er hjernens funksjoner mer tidsmessig presise enn det bare ser ut til at bruk av hastighetskoding. Med andre ord kan essensiell informasjon gå tapt på grunn av hastighetskodens manglende evne til å fange all tilgjengelig informasjon om piggen. I tillegg er svarene forskjellige nok mellom lignende (men ikke identiske) stimuli til å antyde at de forskjellige mønstrene av pigger inneholder et høyere informasjonsvolum enn det som er mulig ble inkludert i en priskode.

Temporale koder (også kalt piggkoder ), bruker de funksjonene i piggaktiviteten som ikke kan beskrives av avfyringshastigheten. For eksempel tid-til-første-pigg etter stimulans begynnelse, fase-av-avfyring med hensyn til bakgrunnsoscillasjoner, egenskaper basert på de andre og høyere statistiske øyeblikkene i ISI- sannsynlighetsfordelingen , spike-tilfeldighet eller nøyaktig tidsbestemte grupper av pigger ( tidsmønstre ) er kandidater til tidsmessige koder. Siden det ikke er noen absolutt tidsreferanse i nervesystemet, overføres informasjonen enten når det gjelder den relative timingen av pigger i en populasjon av nevroner (tidsmønstre) eller med hensyn til en pågående hjernesvingning . (avfyringsfase) En måte som timekoder dekodes på, i nærvær av nevrale svingninger , er at pigger som oppstår i bestemte faser av en oscillerende syklus er mer effektive for å depolarisere det postsynaptiske nevronet .

Den tidsmessige strukturen til et piggetog eller avfyringshastigheten fremkalt av en stimulans bestemmes både av stimulans dynamikk og av arten av den nevrale kodingsprosessen. Stimuli som endres raskt har en tendens til å generere nøyaktig tidsbestemte pigger (og raskt skiftende avfyringshastigheter i PSTH) uansett hvilken nevral kodingsstrategi som brukes. Temporal koding i smal forstand refererer til tidsmessig presisjon i responsen som ikke bare oppstår fra stimulans dynamikk, men som likevel relaterer seg til stimulans egenskaper. Samspillet mellom stimulans og kodingsdynamikk gjør identifiseringen av en tidsmessig kode vanskelig.

I tidsmessig koding kan læring forklares med aktivitetsavhengige synaptiske forsinkelsesendringer. Modifikasjonene kan i seg selv ikke bare avhenge av pigghastigheter (hastighetskoding), men også av piggetidsmønstre (tidsmessig koding), dvs. kan være et spesielt tilfelle av spike-timing-avhengig plastisitet .

Spørsmålet om tidsmessig koding er forskjellig og uavhengig av spørsmålet om uavhengig piggkoding. Hvis hver pigg er uavhengig av alle de andre piggene i toget, bestemmes den neurale kodenes tidsmessige karakter av oppførselen til tidsavhengig avfyringshastighet r (t). Hvis r (t) varierer sakte med tiden, kalles koden vanligvis en hastighetskode, og hvis den varierer raskt, kalles koden for tidsmessig.

Midlertidig koding i sensoriske systemer

For veldig korte stimuli er det mulig at en nevrons maksimale avfyringshastighet ikke er rask nok til å produsere mer enn en enkelt pigg. På grunn av tettheten av informasjon om den forkortede stimulansen som finnes i denne enkelt piggen, ser det ut til at tidspunktet for selve piggen må formidle mer informasjon enn bare den gjennomsnittlige frekvensen av handlingspotensialer over en gitt tidsperiode. Denne modellen er spesielt viktig for lydlokalisering , som oppstår i hjernen i størrelsesorden millisekunder. Hjernen må skaffe en stor mengde informasjon basert på en relativt kort nevral respons. I tillegg, hvis lave avfyringshastigheter i størrelsesorden ti pigger per sekund må skilles fra vilkårlig tett hastighetskoding for forskjellige stimuli, kan det hende at et nevron som prøver å diskriminere disse to stimuliene må vente et sekund eller mer for å samle nok informasjon. Dette er ikke i samsvar med mange organismer som er i stand til å skille mellom stimuli i tidsrammen på millisekunder, noe som antyder at en hastighetskode ikke er den eneste modellen på jobb.

For å redegjøre for den raske kodingen av visuelle stimuli, har det blitt foreslått at nevroner i netthinnen koder for visuell informasjon i ventetiden mellom stimulansutbrudd og første handlingspotensial, også kalt latens til første pigg eller tid-til-første-pigg. Denne typen tidsmessig koding er også vist i det auditive og somato-sensoriske systemet. Den største ulempen ved et slikt kodingsopplegg er dens følsomhet for iboende neuronale svingninger. I den primære visuelle cortex av makaker ble det funnet at tidspunktet for den første piggen i forhold til starten på stimulansen ga mer informasjon enn intervallet mellom pigger. Imidlertid kan interspike-intervallet brukes til å kode tilleggsinformasjon, noe som er spesielt viktig når topphastigheten når sin grense, som i situasjoner med høy kontrast. Av denne grunn kan tidsmessig koding spille en rolle i koding av definerte kanter i stedet for gradvise overganger.

Pattedyrets gustatoriske system er nyttig for å studere tidsmessig koding på grunn av dets ganske distinkte stimuli og de lett merkbare responsene fra organismen. Midlertidig kodet informasjon kan hjelpe en organisme til å skille mellom forskjellige smaker i samme kategori (søtt, bittert, surt, salt, umami) som fremkaller svært like respons når det gjelder piggtall. Den tidsmessige komponenten i mønsteret fremkalt av hver smaksmak kan brukes til å bestemme dens identitet (f.eks. Forskjellen mellom to bitre smaksstoffer, for eksempel kinin og denatonium). På denne måten kan både hastighetskoding og tidsmessig koding brukes i gustatoriske systemet - hastighet for grunnleggende smakstype, tidsmessig for mer spesifikk differensiering. Forskning på pustesystemet hos pattedyr har vist at det er en overflod av informasjon tilstede i tidsmønstre på tvers av populasjoner av nevroner, og denne informasjonen er forskjellig fra den som bestemmes av hastighetskodingsordninger. Grupper av nevroner kan synkronisere som svar på en stimulans. I studier som omhandler den fremre kortikale delen av hjernen i primater, ble det funnet presise mønstre med korte tidsskalaer som bare var noen få millisekunder i lengde på tvers av små populasjoner av nevroner som korrelerte med visse informasjonsbehandlingsatferd. Imidlertid kunne lite informasjon bestemmes ut fra mønstrene; en mulig teori er at de representerte den høyere orden som foregår i hjernen.

Som med det visuelle systemet, i mitral-/tuftede celler i olfaktorisk pære av mus, så det ut til at først-pigg-latens i forhold til starten av en sniffeaksjon koder mye av informasjonen om lukt. Denne strategien for bruk av piggforsinkelse muliggjør rask identifisering av og reaksjon på et luktstoff. I tillegg har noen mitral/tuftede celler spesifikke avfyringsmønstre for gitte luktstoffer. Denne typen ekstra informasjon kan hjelpe til med å gjenkjenne en bestemt lukt, men er ikke helt nødvendig, ettersom gjennomsnittlig piggetall i løpet av dyrets sniffing også var en god identifikator. Langs de samme linjene viste eksperimenter som ble utført med olfaktorisk system av kaniner forskjellige mønstre som korrelerte med forskjellige undergrupper av luktstoffer, og et lignende resultat ble oppnådd i eksperimenter med gresshoppens olfaktoriske system.

Midlertidige programmer for koding

Spesifisiteten til tidsmessig koding krever svært raffinert teknologi for å måle informative, pålitelige og eksperimentelle data. Fremskritt innen optogenetikk gjør det mulig for nevrologer å kontrollere pigger i individuelle nevroner, og tilbyr elektrisk og romlig enkeltcellet oppløsning. For eksempel får blått lys den ionekanalen kanalrhodopsin som åpnes, depolariserer cellen og produserer en pigg. Når blått lys ikke blir registrert av cellen, stenger kanalen, og nevronet slutter å pigge. Mønsteret på piggene matcher mønsteret til blålysstimuliene. Ved å sette inn channelrhodopsin -gensekvenser i mus -DNA, kan forskere kontrollere pigger og derfor visse oppførsler fra musen (for eksempel å få musen til å svinge til venstre). Forskere har gjennom optogenetikk verktøyene til å utføre forskjellige tidsmessige koder i et nevron samtidig som de opprettholder den samme gjennomsnittlige avfyringshastigheten, og kan derved teste om tidsmessig koding forekommer i spesifikke nevrale kretser eller ikke.

Optogenetisk teknologi har også potensial til å muliggjøre korreksjon av piggavvik ved roten til flere nevrologiske og psykologiske lidelser. Hvis nevroner koder informasjon i individuelle piggetidsmønstre, kan nøkkelsignaler gå glipp av ved å prøve å knekke koden mens du bare ser på gjennomsnittlige avfyringshastigheter. Å forstå eventuelle tidsmessig kodede aspekter ved nevrale koden og replikere disse sekvensene i nevroner kan gi større kontroll og behandling av nevrologiske lidelser som depresjon , schizofreni og Parkinsons sykdom . Regulering av piggintervaller i enkeltceller kontrollerer mer nøyaktig hjerneaktivitet enn tilsetning av farmakologiske midler intravenøst.

Kode for avfyring

Phase-of-firing-kode er et nevral kodingsskjema som kombinerer piggetellingskoden med en tidsreferanse basert på svingninger . Denne typen kode tar hensyn til en tidsmerke for hver pigg i henhold til en tidsreferanse basert på fase av lokale pågående svingninger ved lave eller høye frekvenser.

Det har blitt vist at nevroner i noen kortikale sensoriske områder koder for rike naturalistiske stimuli når det gjelder piggetider i forhold til fasen med pågående svingninger i nettverkssvingninger, snarere enn bare når det gjelder piggtall. De lokale feltpotensialsignalene gjenspeiler svingninger i befolkningen (nettverk). Fase-av-avfyringskoden er ofte kategorisert som en tidsmessig kode, selv om tidsetiketten som brukes for pigger (dvs. nettverksoscillasjonsfasen) er en lavoppløselig (grovkornet) referanse for tid. Som et resultat er ofte bare fire diskrete verdier for fasen nok til å representere alt informasjonsinnholdet i denne typen kode med hensyn til fasen av svingninger i lave frekvenser. Fase-av-avfyringskode er løst basert på fasesekresjonsfenomenene observert i stedceller i hippocampus . Et annet trekk ved denne koden er at nevroner holder seg til en foretrukket rekkefølge for spiking mellom en gruppe sensoriske nevroner, noe som resulterer i avfyringssekvens.

Fasekode har vist seg i visuell cortex å også involvere høyfrekvente svingninger . Innen en syklus med gammasvingning har hvert nevron sin egen foretrukne relative avfyringstid. Som et resultat genererer en hel populasjon av nevroner en avfyringssekvens som har en varighet på opptil 15 ms.

Befolkningskoding

Befolkningskoding er en metode for å representere stimuli ved å bruke felles aktivitetene til en rekke nevroner. I populasjonskoding har hvert nevron en fordeling av responser over et sett med innganger, og svarene til mange nevroner kan kombineres for å bestemme en viss verdi om inngangene. Fra det teoretiske synspunktet er populasjonskoding et av få matematisk godt formulerte problemer innen nevrovitenskap. Den forstår de viktigste egenskapene ved nevral koding, og er likevel enkel nok til teoretisk analyse. Eksperimentelle studier har avslørt at dette kodingsparadigmet er mye brukt i sensor- og motorområdene i hjernen.

For eksempel, i det visuelle området medial temporal (MT), er nevroner innstilt på bevegelsesretningen. Som svar på et objekt som beveger seg i en bestemt retning, brenner mange nevroner i MT med et støykorrupt og klokkeformet aktivitetsmønster på tvers av befolkningen. Objektets bevegelsesretning hentes fra populasjonsaktiviteten for å være immun mot svingningene i et enkelt nevronsignal. Når aper blir opplært til å flytte en joystick mot et opplyst mål, vil et enkelt nevron skyte for flere målretninger. Imidlertid skyter den den raskeste i en retning og saktere avhengig av hvor nær målet var til nevronets "foretrukne" retning. Hvis hvert nevron representerer bevegelse i sin foretrukne retning, og vektorsummen av alle nevroner er beregnet (hvert nevron har en avfyringshastighet og en foretrukket retning), peker summen i bevegelsesretningen. På denne måten koder populasjonen av nevroner signalet for bevegelsen. Denne bestemte populasjonskoden kalles populasjonsvektorkoding .

Plass-tid-befolkningskoder, betegnet den gjennomsnittlige-lokaliserte-synkroniserte-respons-koden (ALSR), er avledet for nevral representasjon av hørbare akustiske stimuli. Dette utnytter både stedet eller innstillingen i hørselsnerven, så vel som faselåsing i hver nervefiber hørselsnerve. Den første ALSR-representasjonen var for steady-state vokaler; ALSR-representasjoner av tonehøyde og formantfrekvenser i komplekse, ikke-steady state stimuli ble senere demonstrert for stemmehøyde og formante representasjoner i konsonant-vokal stavelser. Fordelen med slike representasjoner er at globale funksjoner som tonehøyde eller formante overgangsprofiler kan representeres som globale funksjoner over hele nerven samtidig via både hastighet og stedskoding.

Befolkningskoding har også en rekke andre fordeler, inkludert reduksjon av usikkerhet på grunn av nevronal variabilitet og evnen til å representere en rekke forskjellige stimulusattributter samtidig. Befolkningskoding er også mye raskere enn hastighetskoding og kan gjenspeile endringer i stimulusforholdene nesten øyeblikkelig. Individuelle nevroner i en slik populasjon har vanligvis forskjellige, men overlappende selektiviteter, slik at mange nevroner, men ikke nødvendigvis alle, reagerer på en gitt stimulans.

Vanligvis har en kodingsfunksjon en toppverdi slik at aktiviteten til nevronet er størst hvis den perseptuelle verdien er nær toppverdien, og blir redusert tilsvarende for verdier mindre nær toppverdien. Det følger at den faktiske opplevde verdien kan rekonstrueres fra det generelle aktivitetsmønsteret i settet med nevroner. Vektorkoding er et eksempel på enkel gjennomsnitt. En mer sofistikert matematisk teknikk for å utføre en slik rekonstruksjon er metoden for maksimal sannsynlighet basert på en multivariat fordeling av nevronresponsene. Disse modellene kan anta uavhengighet, andre ordenskorrelasjoner eller enda mer detaljerte avhengigheter, for eksempel maksimal entropimodeller av høyere orden eller kopuler .

Korrelasjonskoding

Korrelasjonskodingsmodellen for neuronal avfyring hevder at korrelasjoner mellom aksjonspotensialer , eller "pigger", i et piggetog kan bære ytterligere informasjon utover den enkle timingen av piggene. Tidlig arbeid antydet at korrelasjon mellom piggetog bare kan redusere, og aldri øke, den totale gjensidige informasjonen som finnes i de to piggetogene om en stimulansfunksjon. Imidlertid ble dette senere vist å være feil. Korrelasjonsstruktur kan øke informasjonsinnholdet hvis støy og signalkorrelasjoner har motsatt tegn. Korrelasjoner kan også inneholde informasjon som ikke er tilstede i gjennomsnittlig avfyringshastighet for to par nevroner. Et godt eksempel på dette finnes i den pentobarbital-bedøvede marmoset hørselsbarken, der en ren tone forårsaker en økning i antall korrelerte pigger, men ikke en økning i gjennomsnittlig avfyringshastighet, for par av nevroner.

Uavhengig kodning

Den uavhengige piggkodingsmodellen for neuronal avfyring hevder at hvert enkelt handlingspotensial , eller "pigg", er uavhengig av hverandre pigg i piggetoget .

Posisjonskoding

Plott av typisk posisjonskoding

En typisk populasjonskode involverer nevroner med en Gauss -tuningskurve hvis midler varierer lineært med stimulusintensiteten, noe som betyr at nevronet reagerer sterkest (når det gjelder pigger per sekund) på en stimulans nær gjennomsnittet. Den faktiske intensiteten kan gjenopprettes som stimulansnivået som tilsvarer gjennomsnittet av nevronet med størst respons. Støyen i nevrale responser betyr imidlertid at funksjonen for estimering av maksimal sannsynlighet er mer nøyaktig.

Nevrale responser er støyende og upålitelige.

Denne typen kode brukes til å kode kontinuerlige variabler som leddposisjon, øyeposisjon, farge eller lydfrekvens. Enhver individuell nevron er for mye støy for å trofast kunne kode variabelen ved hjelp av hastighetskoding, men en hel populasjon sikrer større troskap og presisjon. For en populasjon av unimodale tuningskurver, dvs. med en enkelt topp, skalerer presisjonen vanligvis lineært med antall nevroner. Derfor kreves det halve så mange nevroner for halve presisjonen. I kontrast, når tuningskurvene har flere topper, som i rutenettceller som representerer rommet, kan presisjonen i befolkningen eksponensielt skalere med antall nevroner. Dette reduserer antallet nevroner som kreves for samme presisjon.

Sparsom koding

Den sparsomme koden er når hvert element er kodet av den sterke aktiveringen av et relativt lite sett med nevroner. For hvert element som skal kodes, er dette en annen delmengde av alle tilgjengelige nevroner. I motsetning til sensor-sparsom koding, innebærer sensortett koding at all informasjon fra mulige sensorplasser er kjent.

Som en konsekvens kan sparshet være fokusert på temporal sparseness ("et relativt lite antall tidsperioder er aktive") eller på sparsessen i en aktivert populasjon av nevroner. I sistnevnte tilfelle kan dette i en tidsperiode defineres som antall aktiverte nevroner i forhold til det totale antallet nevroner i befolkningen. Dette ser ut til å være et kjennetegn på nevrale beregninger siden informasjon er massivt fordelt på tvers av nevroner sammenlignet med tradisjonelle datamaskiner. Sparsom koding av naturlige bilder produserer wavelet -lignende orienterte filtre som ligner de mottakelige feltene til enkle celler i den visuelle cortex. Kapasiteten til sparsomme koder kan økes ved samtidig bruk av tidsmessig koding, slik det finnes i gresshoppens olfaktoriske system.

Gitt et potensielt stort sett med inndatamønstre, prøver sparsomme kodingsalgoritmer (f.eks. Sparsom autoencoder ) automatisk å finne et lite antall representative mønstre som, når de kombineres i de riktige proporsjonene, gjengir de opprinnelige inngangsmønstrene. Den sparsomme kodingen for inngangen består da av de representative mønstrene. For eksempel kan det veldig store settet med engelske setninger bli kodet av et lite antall symboler (dvs. bokstaver, tall, tegnsetting og mellomrom) kombinert i en bestemt rekkefølge for en bestemt setning, så en sparsom koding for engelsk ville være de symboler.

Lineær generativ modell

De fleste modeller for sparsom koding er basert på den lineære generative modellen. I denne modellen kombineres symbolene lineært for å tilnærme inngangen.

Mer formelt, gitt et k-dimensjonalt sett med reeltallede inngangsvektorer , er målet med sparsom koding å bestemme n k-dimensjonale basisvektorer sammen med en sparsom n-dimensjonal vekt med vekt eller koeffisienter for hver inngangsvektor, slik at en lineær kombinasjon av basisvektorene med proporsjoner som er gitt av koeffisientene resulterer i en nær tilnærming til inngangsvektoren: .

Kodingene som genereres av algoritmer som implementerer en lineær generativ modell, kan klassifiseres i kodinger med myk sparshet og de med hard sparshet . Disse refererer til fordelingen av basisvektorkoeffisienter for typiske innganger. En koding med myk sparshet har en jevn Gauss -lignende fordeling, men toppere enn Gaussian, med mange nullverdier, noen små absoluttverdier, færre større absolutte verdier og svært få veldig store absolutte verdier. Således er mange av basisvektorene aktive. Hard sparshet, derimot, indikerer at det er mange nullverdier, ingen eller knapt noen små absoluttverdier, færre større absoluttverdier og veldig få veldig store absolutte verdier, og dermed er få av basisvektorene aktive. Dette er tiltalende fra et metabolsk perspektiv: mindre energi brukes når færre nevroner skyter.

Et annet mål for koding er om den er kritisk fullstendig eller overfullstendig . Hvis antallet basisvektorer n er lik dimensjonaliteten k av inngangssettet, sies kodingen å være kritisk fullstendig. I dette tilfellet resulterer jevne endringer i inngangsvektoren i brå endringer i koeffisientene, og kodingen er ikke i stand til å håndtere små skaleringer, små oversettelser eller støy i inngangene. Hvis antallet basisvektorer imidlertid er større enn dimensjonaliteten til inngangssettet, er kodingen overfullstendig . Overfullstendige kodinger interpolerer jevnt mellom inngangsvektorer og er robuste under inngangsstøy. Den menneskelige primære visuelle cortex anslås å være fullstendig overfaktorert med en faktor 500, slik at for eksempel en 14 x 14 lapp av inngang (et 196-dimensjonalt rom) er kodet av omtrent 100 000 nevroner.

Andre modeller er basert på matching pursuit , en sparsom tilnærmingsalgoritme som finner de "best matchende" projeksjonene av flerdimensjonale data, og ordlæringslæring , en representasjonslæringsmetode som tar sikte på å finne en sparsom matrisepresentasjon av inndataene i form av en lineær kombinasjonen av grunnelementer så vel som de grunnleggende elementene selv.

Biologisk bevis

Sparsom koding kan være en generell strategi for nevrale systemer for å øke minnekapasiteten. For å tilpasse seg omgivelsene må dyrene lære hvilke stimuli som er forbundet med belønninger eller straffer, og skille disse forsterkede stimuliene fra lignende, men irrelevante. Slike oppgaver krever implementering av stimulus-spesifikke assosiative minner der bare noen få nevroner fra en populasjon reagerer på en gitt stimulus og hvert nevron reagerer på bare noen få stimuli av alle mulige stimuli.

Teoretisk arbeid med spredt distribuert minne har antydet at sparsom koding øker kapasiteten til assosiativt minne ved å redusere overlapping mellom representasjoner. Eksperimentelt har det blitt observert sparsomme representasjoner av sensorisk informasjon i mange systemer, inkludert syn, audition, berøring og olfaksjon. Til tross for det akkumulerte beviset for utbredt sparsom koding og teoretiske argumenter for dens betydning, har det imidlertid vært vanskelig å få en demonstrasjon av at sparsom koding forbedrer stimulus-spesifisiteten til assosiativt minne.

I Drosophila olfaktoriske system antas sparsom luktkoding av Kenyon-cellene i soppkroppen å generere et stort antall nøyaktig adresserbare steder for lagring av luktspesifikke minner. Sparsens styres av en negativ tilbakemeldingskrets mellom Kenyon -celler og GABAergic anterior paired lateral (APL) nevroner. Systematisk aktivering og blokkering av hvert ben i denne tilbakemeldingskretsen viser at Kenyon -celler aktiverer APL -nevroner og APL -nevroner hemmer Kenyon -celler. Å forstyrre tilbakemeldingsløyfen til Kenyon-cellen-APL reduserer sparsomheten i Kenyon-celleluktresponser, øker korrelasjoner mellom lukt og forhindrer fluer i å lære å diskriminere lignende, men ikke ulik, lukt. Disse resultatene antyder at tilbakemeldingshemming undertrykker Kenyon-celleaktivitet for å opprettholde sparsom, dekorrelert luktkoding og dermed luktspesifisiteten til minner.

Se også

Referanser

Videre lesning