le rappresentazioni distribuite - Dipartimento di Filosofia

Transcript

le rappresentazioni distribuite - Dipartimento di Filosofia
Andrea Danielli
Nuove prospettive per il
rappresentazioni distribuite
connessionismo:
le
[Bozza semidefinitiva del Capitolo VI de Le forme della mente]
1 RAPPRESENTAZIONI DISTRIBUITE
1.1 Perché un capitolo sulle rappresentazioni
All’interno di questo libro il filo conduttore è stato l’organizzazione del
cervello, abbiamo analizzato il modo in cui l’informazione viene elaborata e,
prima ancora, distribuita, immagazzinata, condivisa. Le domande guida sono state
le seguenti: ci sono aree cerebrali specifiche? E, se sì, come comunicano tra loro?
Come si organizzano, come gestiscono memoria e novità? Abbiamo affrontato gli
approcci classici, modularismo e connessionismo; abbiamo indagato gli studi
promettenti sulla sincronizzazione.
Perché ora parlo di rappresentazioni? E, soprattutto, perché sono
«distribuite»?
A mio avviso il concetto di rappresentazione ha due motivi di interesse: il primo,
campanilistico (sono un filosofo) sta nell’essere un concetto dalla lunga tradizione
filosofica, il secondo, neuroscientifico, sta nell’essere in grado di rispondere alle
esigenze di comprensione su memoria, elaborazione e comunicazione. Infatti, non
lo nascondo, auspico che questo capitolo possa essere un tentativo di gettare un
ponte tra filosofia e neuroscienze. Penso che la mia trattazione possa inserirsi
all’interno della tradizione connessionista, anche se intendo conservare la
dimensione simbolica del mentale, proprio impiegando il concetto di
rappresentazione distribuita.
1.2 Struttura del capitolo
Nella parte iniziale del capitolo dedico la mia attenzione al concetto di
rappresentazione, dando una rapida panoramica della sua trattazione nella
filosofia della mente attuale; propongo poi una mia definizione, con riferimenti
neuroscientifici, che possa agganciare la rappresentazione alla base neurale che la
produce. Infatti nelle mie intenzioni la rappresentazione è l’unità di informazione
che si scambiano le diverse aree cerebrali nello svolgimento delle funzioni
cognitive superiori; grazie ad alcune sue caratteristiche, che vedremo in dettaglio
in seguito, è in grado di organizzare l’elaborazione dell’informazione. Nel cuore
del capitolo propongo un modello che, spero, possa spiegare alcune modalità di
apprendimento mediante l’associazione di rappresentazioni di modalità diverse,
concentrandomi in particolar modo sulla funzione che potrebbero svolgere le
rappresentazioni fonologiche. La parte finale è dedicata ad ampliare la portata del
modello ed a commentarne problemi e difficoltà teoriche. Cerco di seguire una
linea espositiva che accompagni il lettore, introducendolo prima alla materia, poi
rendendolo consapevole dei problemi e proponendo un percorso che ci avvicini
1
alla soluzione. Una volta raggiunta la soluzione, ne descrivo le caratteristiche
prima in astratto, poi con esempi e casi concreti. Ho tentato di costruire un
capitolo in cui il livello di difficoltà aumenti progressivamente: la parte Un ultimo
sforzo, equilibri e dinamiche, quasi un’appendice, per quanto concettualmente
impervia è fondamentale per dare completezza alla mia argomentazione.
1. 3 Rappresentazioni e concetti: che cosa sono?
Del termine «rappresentazione» esistono molte definizioni; esaurirne la storia,
soprattutto filosofica, sarebbe eccessivo. Perciò ne propongo due che hanno il
pregio di essere semplici e sufficientemente generali: «ogni attività percettiva che
porta al riconoscimento, all’identificazione o alla denominazione necessita
dell’attivazione di rappresentazioni immagazzinate in memoria» [Houdé et al.,
1998; trad. it. 2000]. «Una rappresentazione può essere ogni oggetto o stato fisico
che è prodotto in qualche modo per stare al posto di qualche altro oggetto o stato
fisico (o una disgiunzione estremamente complessa di stati o oggetti – includente
oggetti astratti, quali i numeri)»1.
Date queste definizioni preliminari ora occorre capire che significato abbiano
all’interno dei problemi che abbiamo fin qui affrontato. Una rappresentazione è
un’entità mentale che ha la funzione di riprodurre gli oggetti, le relazioni e le
proprietà della realtà esterna; la rappresentazione di un tavolo «sta per» il tavolo,
ma non solo: si offre ad una serie di operazioni mentali rese possibili dal suo
possedere proprietà semantiche2. Significa cioè che il soggetto può disporre della
rappresentazione per combinarla con altre rappresentazioni, o per derivarne altre,
nel ragionamento e nella comunicazione, ad esempio. Per capire meglio questo
punto occorre riflettere sul fatto che di «tavolo» possiamo avere diverse
rappresentazioni: il suono della parola «tavolo», l’immagine visiva, il concetto di
tavolo. Ognuna di queste rappresentazioni può servire ad una funzione diversa: il
suono ed il concetto per parlare, per derivare, ad esempio, la rappresentazione di
una sedia, mentre l’immagine può essere utile per costruire un nuovo tavolo o per
muoversi in una stanza al buio. Uno dei più difficili ambiti di indagine riguarda le
relazioni che intercorrono tra rappresentazioni e oggetti della rappresentazione. In
questo capitolo non posso occuparmi di un problema così complesso: cerco di
affrontare le rappresentazioni trattandole come degli oggetti creati da aggregati
neurali e le cui dinamiche possono essere studiate secondo una logica biologica;
per questo motivo la definizione che presento ora cerca di riferirsi specialmente al
soggetto ed alla sua intuizione, evitando le relazioni rappresentazione-mondo3.
1.4 Il significato nel capitolo
Per capire il modo in cui il termine verrà usato nel capitolo propongo ora
una mia definizione di rappresentazione: «una rappresentazione è la minima unità
cognitiva funzionale costituita da una popolazione neurale organizzata secondo
patterns spaziotemporali specifici e caratterizzati da bassa variabilità»4.
Minima unità cognitiva funzionale
2
Parlare di «minima unità cognitiva funzionale» ci pone immediatamente
numerose difficoltà che non posso nascondere: siamo di nuovo di fronte al
problema di spezzare la mente, di imporre una nostra logica ad un sistema che non
sappiamo bene come funzioni. È ben difficile parlare di massimo e minimo
quando si ha a che fare con piani diversi che si intersechino secondo modalità
ignote e, quando, come vedremo in seguito, ci troviamo di fronte ad una logica
combinatoria. Pezzetti che si combinano per dare vita a pezzi più grandi che poi si
combinano tra loro. Come chiamare i pezzi di ogni livello?
Per me è facile parlare di rappresentazioni audio e video, dato che sono
riccamente trattate in letteratura e si prestano ad una comprensione intuitiva; il
mio lavoro concernerà soprattutto queste due modalità. Per questo parlo di «unità
cognitiva»: perché il metro di giudizio dell’unità è la nostra coscienza: ciò che
vediamo unico e completo mentre percepiamo o ragioniamo è una
rappresentazione: ad esempio la parola «musica» o l’immagine di una chitarra;
non è una rappresentazione un insieme di suoni privi di significato5, o un insieme
di macchie di colore da cui non sia possibile risalire all’oggetto rappresentato.
Naturalmente, ne sono consapevole, una simile interpretazione esclude l’analisi
dei sistemi motori: non essendo coscienti le memorie dei movimenti è ben
difficile decidere dove e come scomporre le nostre azioni6.
Possiamo comunque dedurre dalla mia definizione che una
rappresentazione può essere scomposta in costituenti più elementari, da un punto
di vista strutturale: un’immagine può essere formata dal contributo di gruppi
neurali che si occupano di colori, altri che si occupano di linee verticali, altri di
linee orizzontali7. Come chiamare e scoprire questi microgruppi resta a mio avviso
ancora problematico.
Patterns spaziotemporali specifici
I raggruppamenti che danno vita alle rappresentazioni si costituiscono
mediante la coordinazione dei patterns di scarica dei neuroni. Per dare un’idea
molto intuitiva, pensiamo ai patterns di scarica come a delle equazioni che, su un
piano cartesiano, sono usate per descrivere figure.
Bassa variabilità
La formazione di un raggruppamento che dà luogo ad una
rappresentazione deve avvenire con una bassa percentuale di variazioni: ciò
significa che possono non attivarsi tutti i neuroni (ricordiamoci che abbiamo a che
fare con decine di milioni di neuroni, o più, non sono disponibili stime a
riguardo), ma ciò non dovrà menomare la rappresentazione. Se invece la
variabilità è superiore ci troveremo con una diversa rappresentazione, avrà luogo
una sorta di salto8.
1. 5 Spiegazioni terminologiche
Nella mia analisi mi riferirò al termine generale «rappresentazione» e non
mi occuperò di quello che considero un sottoinsieme: il «concetto». Infatti il
3
termine concetto è specifico, riferito al linguaggio e, soprattutto, ha un’enorme
tradizione filosofica che rende complessa la sua trattazione. La terminologia in
questo capitolo sarà fonte continua di problemi: infatti spunteranno altre due
parole spinose: simbolo e qualia. Con simbolo restiamo ancora nella definizione
di rappresentazione: un simbolo è un qualcosa che rimanda ad un'altra cosa
tramite delle relazioni di analogia e somiglianza (per esempio la bilancia che
simbolizza la giustizia). I qualia, concetto più che mai problematico in filosofia
della mente, sono solitamente considerati gli «stati qualitativi dell’esperienza
cosciente». Una definizione meno banale forse non è possibile, meglio usare degli
esempi: il rosso di un’immagine, il dolore che provo per una ferita, il suono delle
parole, sono tutti qualia (quale al singolare). Ciò che penso sia importante mettere
in luce, per distinguere meglio dal simbolo, è che un quale non rimanda ad un
oggetto in virtù di un’analogia o somiglianza: innanzitutto il quale non è un
oggetto; non ha un contenuto semantico, immediatamente spendibile. È ad un
livello più basso, costitutivo, è la «materia» con cui costruiamo i nostri pensieri9.
Infatti se penso alle parole queste eccheggiano nella mia mente come suoni (più in
là parlerò di codifica fonologica): se penso ad una parola astratta, «intelligenza»,
sento nella mia testa una voce (sempre la solita) che dice «intelligenza». Se penso
a simboli avrò nella mia mente delle immagini colorate. Non intendo affrontare
spinose riflessioni sui qualia, sulla loro origine e sulle relazioni tra qualia e
attività mentale. Occorrerebbe molto spazio. Il mio punto di vista si pone però
come antineutrale: significa che cercherò di fare una trattazione minimale e basata
unicamente su ciò che risulta praticamente indiscutibile10.
1.6 Un excursus, fondamentale
Come abbiamo già visto nel capitolo I sul confronto tra modularismo e
connessionismo, il connessionismo viene considerato un approccio «subsimbolico» allo studio del mentale; è nato in opposizione all’Intelligenza
Artificiale classica, simbolica, e a lungo questo suo aspetto sub-simbolico non ha
pesato sul suo sviluppo. Eppure pensare che il cervello sia un’unica enorme rete
neurale si scontra con il fatto che tutto il nostro ragionamento sembra essere
simbolico. Ragioniamo usando parole, sentendo dentro di noi un dialogo quasi
ininterrotto. Il ragionamento discorsivo (ma anche quello matematico) sembra
avere alla base un comportamento ordinato da regole; la teoria computazionale del
mentale, che ha origine nei lavori pioneristici di Turing [1950] e che a lungo ha
influenzato filosofia della mente e psicologia, considera il pensiero come il
prodotto di operazioni (secondo regole) svolte su simboli; la concezione
chomskiana, quasi un paradigma, vede nella sintassi la base del linguaggio.
Riuscire ad ottenere in una rete neurale un comportamento governato da regole
che agiscono su simboli è ancora difficile11. Delle reti neurali sappiamo solo gli
input e gli output; non possiamo vedere al loro interno nulla, se non i pesi dei
neuroni artificiali, ma da questi è difficile riconoscere simboli e regole.
Cercherò di proporre in questo capitolo una soluzione che sia capace di
conciliare connessionismo e simboli: cercherò di spiegare in che modo l’enorme
rete di neuroni dia luogo a rappresentazioni e, soprattutto, come sia possibile
memorizzare l’immenso numero di rappresentazioni che possediamo in memoria.
Riprendo quindi la mia definizione di rappresentazione; tale definizione,
parlando di popolazione neurale, è già adeguata per le rappresentazioni distribuite.
4
Per spiegare meglio il concetto mi servirò di una metafora: pensiamo alle
coreografie realizzate allo stadio: ogni tifoso è un neurone; per realizzare una
scritta si attivano migliaia di tifosi, ognuno dei quali ha in mano di solito un
cartoncino colorato. Da solo un tifoso non può mandare alcun messaggio. La
coreografia (la rappresentazione) è possibile solo se tutti i tifosi collaborano nello
stesso momento, non se alcuni alzano il cartoncino in momenti diversi. Quando
ricordiamo un’immagine nel cervello si attiveranno numerosi raggruppamenti,
ognuno dei quali andrà a costituire un pezzetto dell’immagine; gli aggregati
neurali coinvolti possono anche essere spazialmente separati, o, mi spiego meglio,
possono darsi microraggruppamenti collegati tra loro mediante pochi neuroni
(pensiamo alle macchie sulla pelliccia del dalmata collegate da dei fili molto
sottili). Inoltre possono essere su più livelli di elaborazione12. Un altro fattore
fondamentale delle rappresentazioni distribuite è la loro origine combinatoria: un
neurone partecipa alla formazione di diverse rappresentazioni; il suo contributo
dipende dai «compagni», dagli altri neuroni che stanno collaborando con lui.
Secondariamente, penso che le qualità specifiche possano essere codificate da
gruppi che si combinano per dare vita alle rappresentazioni: per esempio una
parola è formata da fonemi. Ogni fonema è il prodotto caratteristico di un
raggrupamento neurale. Per costruire parole diverse si attiveranno in diverso
ordine i gruppi-fonemi richiesti dalla parola. «Gatto» e «matto» comporteranno
l’attivazione di gran parte degli stessi raggruppamenti neurali. Ritornando alla
metafora della coreografia allo stadio: se i tifosi si accordano13 per alzare il proprio
cartoncino in momenti diversi potranno dare vita a scritte diverse. Diventa quindi
molto importante la dimensione temporale.
Una volta che abbiamo capito che cosa sia una rappresentazione distribuita
siamo pronti per affrontare i problemi che comporta: capire come si organizzano i
raggruppamenti e come si memorizzano (e riattualizzano). Nelle parole precise di
Singer [1998, 1831]:
Nella codifica ad opera di aggregati neurali devono essere soddisfatti due
importanti requisiti. Primo, è richiesto un meccanismo di selezione che permetta una
associazione di neuroni dinamica e al tempo stesso duratura all’interno di aggregati
funzionalmente coerenti [aventi la stessa funzione]. Secondo, le risposte dei neuroni che
sono stati identificati come raggruppabili devono essere etichettate così che possano
essere riconosciute da livelli di elaborazione successivi come legate tra loro14.
Dobbiamo dare vita a gruppi distinti e coerenti combinando correttamente
i sottocomponenti. Se siamo in uno spazio bidimensionale possiamo risolvere il
problema introducendo una terza dimensione. Agiamo dalla terza dimensione per
spostare e ordinare le figure bidimensionali e dare vita a figure più complicate.
Dato che nel cervello siamo in tre dimensioni come possiamo comportarci?
Utilizziamo la quarta dimensione, il tempo. In effetti, come anticipato nella
metafora dello stadio, se diciamo ai tifosi di alzare i loro cartoncini in momenti
diversi possiamo ottenere diverse scritte (magari le lettere saranno distanti, ma
non badiamo troppo alla precisione!). Penso che il modo in cui i neuroni si
scambiano i tempi di attivazione possa essere legato ai patterns di scarica; i
patterns di scarica sono costituiti dalle scariche dei neuroni e dalle pause tra di
esse. Non diversamente da un codice morse, per intenderci.
5
2 ENTRANDO NEL MODELLO
Come si ricorderà, si pongono principalmente due problemi per chi voglia
sostenere una teoria sulle rappresentazioni distribuite: il primo consiste nel
riuscire a distinguere i diversi raggruppamenti, il secondo nel memorizzare questi
raggruppamenti. Il primo problema dipende dal fatto che una rappresentazione è
costituita dalla combinazione di diversi raggruppamenti neurali15. Il secondo
problema discende dalla logica combinatoria: dove si può memorizzare una
combinazione? In che modo? Come fa l’area cerebrale a «sapere» come
riorganizzarsi ogni volta?
2.1 I codici impliciti
La lettura di questi passaggi mi ha aiutato ad avviarmi verso la soluzione
che presento in questo capitolo:
Secondo questo insieme di teorie, la memoria visiva a lungo termine delle forme
è immagazzinata in un codice astratto nel lobo temporale inferiore. Per lo meno nel
cervello delle scimmie, questa memoria è immagazzinata usando un codice
popolazionale; (…) l’attivazione in gruppi di colonne – non sequenze di attivazione in
aree organizzate topograficamente – specifica la forma. […] la geometria locale delle
forme è solo implicita nella rappresentazione della memoria a lungo termine (LTM), ed è
resa esplicita generando patterns16 di attivazione nella corteccia visiva primaria,
topograficamente organizzata17 [Kosslyn, Thompson 2003, 724-5].
Quello che ho trovato interessante, e che sottolineo, è l’idea di codice
astratto; il codice astratto viene memorizzato in una popolazione di neuroni;
l’attivazione di questa popolazione dà vita ad una rappresentazione distribuita
mediante l’impiego di patterns di scarica. Penso che una possibile soluzione ai
problemi sopracitati sia in queste righe: i patterns di attivazione servono per
ricostruire con precisione la rappresentazione combinatoria, il codice che conserva
la combinazione è contenuto in un’altra area rispetto a dove avrà luogo la
combinazione. Penso che sia questo il passaggio fondamentale. Dividere l’area
che conserva l’informazione dall’area su cui quell’informazione agisce permette
di organizzare i complicati raggruppamenti neurali che sottendono una
rappresentazione; riprenderò la metafora della coreografia allo stadio per rendere
comprensibili le difficoltà che dobbiamo risolvere. Immaginate che i tifosi non
abbiano diviso prima lo stadio in zone precise e distribuito i cartoncini colorati, e
che debbano accordarsi tra loro al momento per dar vita alla coreografia. Migliaia
di tifosi che si passano i cartoncini cercando di capire quello che fanno i vicini,
ma senza poter vedere da lontano la scritta o l’immagine a cui cercano di dare
vita. Credo sia impossibile che riescano a trovare un equilibrio e, soprattutto, che
riescano a dare vita ad una qualsiasi rappresentazione dotata di senso.
Immaginiamo invece che sia possibile ad un tifoso di vedere la curva dall’alto, e
che possa, magari gridando, comunicare ai tifosi come organizzarsi. Abbiamo una
forma astratta della rappresentazione (mediante un codice diverso), infatti il tifoso
«privilegiato» comunicherà tramite parole, non colori. E sarà abbastanza facile
memorizzare le istruzioni che darà. Guidati in questo modo, i tifosi saranno in
grado di distribuirsi i cartoncini e dare vita a rappresentazioni complesse e
6
precise18. La necessità di un codice astratto oltre che in Kosslyn, viene evidenziata
da Chalmers [1990, 54]:
Van Gelder ha espresso questa distinzione notando che l’implementazione
connessionista di strutture composizionali ha impiegato una «composizionalità
funzionale», piuttosto che la «composizionalità concatenativa» che è stata impiegata in
approcci di intelligenza artificiale più tradizionali. La composizionalità funzionale è
raggiunta con l’uso di funzioni (possibilmente di una certa complessità) che operano su
esemplari [tokens] simbolici, e producono una rappresentazione codificata di una struttura
composizionale complessa. Questi modelli differiscono dai modelli simbolici nel fatto
che la rappresentazione composizionale non richiede di contenere espliciti esemplari
[tokens]19 fisici dei costituenti originali, ma possa invece contenere solamente
l’informazione originale in una modalità davvero implicita20.
2.2 Il modello
Come posso quindi riassumere le diverse idee che fin qui ho discusso, le
rappresentazioni distribuite, il codice astratto, le combinazioni? Do una prima
formulazione della mia proposta, la amplierò e chiarirò strada facendo:
a) una rappresentazione distribuita si realizza mediante la compartecipazione
di diversi sottogruppi di neuroni, ognuno dei quali codifica all’incirca una
qualità (se siamo in una corteccia visiva ogni sottogruppo si occuperà, per
esempio, di colori precisi: chi del rosso, chi del giallo, etc.);
b) la memoria di una rappresentazione distribuita sta in un altro
raggruppamento neurale legato tramite aree associative multimodali21;
c) l’apprendimento si ottiene associando nuove rappresentazioni a
rappresentazioni già possedute;
d) nel passaggio attraverso aree associative multimodali si ottiene la
condensazione e la realizzazione di un codice astratto; siamo di fronte
all’azione di principi gerarchici;
e) la codifica si ha mediante patterns di scarica.
2.2.1 Aree associative multimodali
Avendo già analizzato e spiegato che cosa sia una rappresentazione
distribuita intendo occuparmi del punto b, presentando delle riflessioni sulle aree
associative multimodali seguite da un esempio concreto di associazione
multimodale.
Interazioni multimodali
«L’esperienza quotidiana ha luogo in modalità multiple. La formazione di
un registro duraturo dell’esperienza, e la sua incorporazione associativa nella
(pre)esistente base di conoscenza, necessita l’integrazione multimodale»22
[Mesulam 1998, 1024]. Per Mesulam l’apprendimento richiede interazioni
multimodali. Cercherò di mostrare in che modo questo apprendimento possa avere
luogo. Ma, anticipo fin da ora, le cortecce associative multimodali non sono dei
depositi di memoria multimodale, bensì solo delle aree di collegamento e
7
comunicazione: «le aree transmodali non sono necessariamente centri dove risiede
una conoscenza convergente, ma passaggi (o centri, canali, connessioni) per
accedere alla appropriata informazione distribuita»23 [Mesulam 1998, 1024].
La memoria vera e propria deve essere nelle aree unimodali. Come
vedremo, la memoria di una rappresentazione deve essere in un’altra
rappresentazione.
Un esempio di associazione multimodale
Il motivo per cui mi interesso di associazioni multimodali sta
nell’importanza che attribuisco alla codifica fonologica, a quello cioè che
percepiamo come un pervasivo dialogo interiore. Infatti le mie ricerche sono
cominciate dal notare come tutto il nostro ragionamento passi per parole; più
precisamente, passi per i suoni che hanno queste parole. Mi sono domandato se
questa non sia una semplice combinazione, e se il fonologico non abbia in effetti
la funzione privilegiata di organizzare gran parte delle rappresentazioni mentali.
Anche la teoria sviluppata da Dehaene per spiegare il ragionamento
matematico attribuisce una certa importanza alla codifica fonologica: insieme ad
aree non linguistiche deputate alla quantificazione e manipolazione di grandezze
esistono aree che mostrano caratteristiche verbali laddove siano richieste
conoscenze matematiche esatte24.
Tutta una serie di teorie sulla memoria a breve termine attribuiscono
notevole importanza all’operazione di codifica fonologica: penso a Baddeley
[1996] e Vallar [2006]. La memoria a breve termine si serve di una codifica
fonologica: «il soggetto deve prima tradurre le rappresentazioni visive della lettera
nelle loro rappresentazioni fonologiche corrispondenti (i nomi delle lettere)»25
[Smith 1998, 12063].
Non potrebbe essere dovuto al fatto che il fonologico organizza le
rappresentazioni nuove prima che avvenga l’effettivo apprendimento (proprio
permettendone la combinazione)?
Per poter immagazzinare nella memoria a lungo termine le nuove
rappresentazioni occorre un periodo di ripetizione (rehearsal); interpreto tale
periodo di ripetizione come un momento necessario affinchè le diverse
combinazioni possano trovare prima un loro equilibrio e poi associarsi: in effetti
le associazioni devono avvenire tra sistemi stabilizzati perché possano dar vita a
risultati durevoli (si capirà meglio in seguito, si veda: Un ultimo sforzo: equilibri e
dinamiche). Se pensiamo poi a tutto l’apprendimento concettuale, questo è
vincolato alla codifica fonologica. Nel passaggio seguente si citano poi degli studi
che evidenziano la traduzione degli stimoli visivi in rappresentazioni fonologiche.
Nella mia proposta mi occupo di associazioni tra rappresentazioni visive e
fonologiche.
Questo suggerisce la possibilità che l’area parietale di interesse possa essere
attivata nei nostri studi di neuroimmagine perché è parte del circuito interessato nella
traduzioni del materiale verbale presentato visivamente in un codice fonologico, e in
seguito l’area semplicemente rimane attiva per qualche secondo, e questa persistenza
della attività costituisce la pura funzione di immagazzinamento della Memoria di Lavoro
verbale26 [Smith 1998, 12063].
8
Occorre poi ricordare alcuni importanti studi citati da Friston et al. [1996]
che sembrano davvero promettenti, infatti evidenziano delle forti relazioni tra aree
deputate al riconoscimento di oggetti e circuito fonologico: «[…] l’attivazione
nell’area inferotemporale, dovuta al riconoscimento di oggetti, veniva
profondamente modulata dal recupero fonologico del nome dell’oggetto»27.
Studiare quindi le relazioni multimodali può essere molto interessante per
capire l’organizzazione dell’informazione nel cervello. E, inoltre, spero possa
essere utile a capire le relazioni tra pensiero (costituito soprattutto da
rappresentazioni fonologiche) e sua base neurobiologica (le popolazioni di
neuroni sottese alle rappresentazioni).
2.2.2 Associazione di nuove rappresentazioni a vecchie rappresentazioni
Una rappresentazione nuova è costituita dall’associazione, secondo nuove
modalità di combinazione, di sottogruppi già noti. Mediante l’associazione di
questa rappresentazione ad un’altra rappresentazione si creano dei percorsi
all’interno delle aree associative multimodali; «l’apprendimento di un nuovo input
consiste nel selezionare e rinforzare un gruppo (o più gruppi) appropriato che
risuona28 con l’input»29 [Izhikevich 2006, 270].
Nella prima parte della citazione abbiamo la formazione della
rappresentazione: un gruppo (o più gruppi) risuonano con l’input. Io sarei
favorevole ad una dinamica compositiva tra più gruppi, ognuno dei quali codifica
una qualità (feature), della rappresentazione unitaria; questo per motivi di
economia e sulla base di dati neuroscientifici favorevoli a raggruppamenti locali
aventi qualità simili (rimando alla citazione precedente di McIntosh [2000], pag
6). Le stesse parole di Izhikevich sostengono la logica combinatoria: «assegnare la
rappresentazione (il significato) al gruppo consiste nel potenziare le connessioni
deboli che collegano questo gruppo con altri gruppi co-attivi nello stesso tempo,
ossia, inserire il gruppo nel contesto di altri gruppi che hanno già (delle)
rappresentazioni»30 [Izhikevich 2006, 270].
Io non penso che una rappresentazione derivi il suo «significato»
(qualunque cosa voglia dire; parlerei più di unicità) solo dal legame con altre più
antiche: piuttosto il significato deriva dalla combinazione dei suoi costituenti, ed
è, quindi, intrinseco31. Ma quello che mi interessa cogliere da questa citazione è il
potenziamento delle connessioni tra gruppi co-attivi: nella mia ipotesi siamo tra
relazioni multimodali. Credo di dover reinterpretare un po’ l’idea di Izhikevich.
Innanzitutto propongo di immaginare che la rappresentazione sia formata da più
gruppi; secondariamente, l’apprendimento di una nuova rappresentazione non si
ha, a mio avviso, mediante l’irrobustimento delle connessioni tra gruppi
costituenti. Piuttosto penso si abbia nella memorizzazione delle combinazioni in
un’altra area rispetto a dove hanno luogo. Ho paura in effetti che l’irrobustimento
potrebbe portare, a livello locale (e unimodale), ad un’eccessiva connettività che
renderebbe difficile fare discriminazioni tra rappresentazioni diverse.
2.2.3 Produzione di un codice astratto
Propongo che la costruzione della rappresentazione dia luogo ad un codice
implicito, astratto, che, legandosi ad una rappresentazione coattiva, permette la
9
memorizzazione della combinazione. Ad ogni livello di elaborazione cambia
notevolmente il valore dei patterns prodotti; salendo verso aree più complesse e di
integrazione i patterns riporteranno le relazioni tra gruppi, non solo all’interno di
gruppi. Studi sui processi all’origine della percezione visiva sembrano sostenere
questa idea, ad esempio Tanaka [1996, 120] sottolinea la presenza di vari livelli di
selettività:
Le aree TEO e V4 sono state quindi caratterizzate dalla mistura di cellule con
vari livelli di selettività. Possiamo considerare questa mistura di varie cellule come
un’evidenza del fatto che la selettività è costruita attraverso reti locali in queste regioni.
Se campioniamo cellule da una rete locale in cui le risposte selettive a caratteristiche
complesse sono costruite integrando caratteristiche semplici, il campione dovrebbe
includere cellule con diversi livelli di selettività. Cellule situate vicino agli input
dovrebbero essere attivate massimamente da caratteristiche semplici, cellule vicine agli
output dovrebbero rispondere solo a caratteristiche complesse, e cellule ai livelli
intermedi dovrebbero mostrare caratteristiche intermedie. Le aree che soddisfano queste
condizioni sono state TEO e V432.
Per capire l’astrattezza del codice, penso possa essere utile anche questa
citazione: «[…] una memoria non è una rappresentazione, ma rispecchia il modo
in cui il cervello ha modificato la propria dinamica per consentire la ripetizione di
una prestazione» [Edelman, Tononi 2000, 113].
Per quanto a tutta prima possa sembrare contraddittorio con quanto da me
sostenuto, in realtà aiuta a chiarire meglio il mio punto di vista. La memoria di
una rappresentazione A sta infatti nel legame con un’altra rappresentazione B che
sia capace di riattivare le dinamiche compositive che sottendono A. Come
conseguenza deriviamo che un codice implicito ha senso solamente se viene
interpretato da qualche rappresentazione, non in sé stesso.
2.2.4 La codifica avviene mediante patterns di scarica
Il recupero di una rappresentazione sarà ottenuto inviando un codice
capace di far risuonare i raggrupamenti costitutivi. In questa citazione di
Izhikevich [2006, 26] penso che la parola input possa essere interpretata anche
come codice (basta che l’input provenga da altre aree della corteccia, invece che
da organi di senso): «[…] ogni volta che l’input è presentato al network, un
gruppo (o più gruppi) policronico il cui patterns di scarica risuona con l’input è
attivato (cioè, i neuroni che costituiscono il gruppo policronizzano)»33.
2.3 Il modello, nel concreto
Devo partire da una breve puntualizzazione. Una rappresentazione non è
subito la memoria dell’altra. Il compito di memorizzare una rappresentazione
unimodale viene inizialmente svolto dall’ippocampo in combinazione con la
corteccia. Le rappresentazioni contenute nella corteccia si associano tra loro nel
tempo, mentre l’ippocampo perde le tracce mnestiche. Il modo in cui presento il
modello non tiene conto della dimensione temporale, o, meglio, rende istantanei
fenomeni che richiedono del tempo. Questo perché, allo stato attuale delle
conoscenze, sarebbe molto difficile spiegare questi fenomeni correttamente.
10
Facendo una rapida riflessione sulle relazioni tra rappresentazioni che
possa essere interessante studiare ne identifico almeno tre casi: apprendimento di
due rappresentazioni sconosciute, apprendimento di una sconosciuta associata ad
una nota, recupero di una rappresentazione mediante la rievocazione di quella più
semplice.
Parliamo del primo caso, apprendimento di due nuove rappresentazioni,
con esempi concreti. Una nuova immagine (la foto di una sogliola) viene
presentata al soggetto; nelle aree occipitali34 (dove si processano le informazioni
visive) si crea una rappresentazione visiva topografica35 che rappresenta
l’immagine (vediamo la sogliola). Ad un livello superiore di elaborazione,
laddove avviene il riconoscimento degli oggetti, hanno probabilmente luogo delle
dinamiche scompositive: la rappresentazione topografica si trasforma in un
insieme di elementi costitutivi più semplici36. Per esempio la sogliola potrebbe
scomporsi in un triangolo per il «muso», un rettangolo per il corpo, altri due
triangoli per la parte finale e la coda. L’insieme dei patterns di scarica prodotti da
ogni elemento costituisce la rappresentazione astratta dell’oggetto. Probabilmente
è questa rappresentazione astratta, non quella topografica, che si combina con
quella fonologica. Nel frattempo l’immagine presentata ha un nome: «sogliola».
Nelle cortecce uditive si combineranno diversi fonemi per dare vita alla
rappresentazione corrispondente a «sogliola». Abbiamo così che nelle cortecce
unimodali si sono formate delle rappresentazioni unimodali: una volta che hanno
raggiunto l’equilibrio37 mandano dei patterns costanti verso le cortecce
associative. Nelle cortecce associative si incroceranno i patterns costanti
provenienti dalle due rappresentazioni formate; si irrobustiranno le sinapsi e i
percorsi associativi impiegati per mettere in comunicazione le due
rappresentazioni. Perché si creino dei percorsi associativi occorre che le sinapsi
siano attivate con una certa frequenza, più volte e ravvicinatamente38. Questo
richiede che le due rappresentazioni si mandino più volte lo stesso segnale per
permettere simili ripetizioni.
Lo stesso meccanismo si avrà di fronte ad una rappresentazione ignota che
si associa ad una nota: comunque sia si organizzeranno le popolazioni neurali e,
raggiunta la stabilità, si associeranno tra loro le rappresentazioni presenti
contemporaneamente. Quando ci si trova di fronte ad un compito di recupero di
una rappresentazione in memoria penso agisca il seguente meccanismo: si crea
prima una rappresentazione di più facile accesso (penso sia solitamente di
carattere fonologico), mediante quello che sperimentiamo come ragionamento, o
dialogo interiore. La sua attivazione darà luogo all’emissione di patterns
caratteristici. Questi attraverseranno le cortecce associative multimodali e
riattiveranno l’immagine, per quanto complessa e frutto di molte combinazioni,
che era associata al nome. Il principio dovrebbe essere quello della «risonanza»
proposto da Izhikevich39.
Occorre però fermarci un istante. L’operazione di creazione di una
rappresentazione a partire da un’altra non è semplice e, a mio avviso, c’è una certa
differenza tra un codice prodotto da un sistema in equilibrio e il codice che serve
per dare vita alle combinazioni prima dell’equilibrio. Torniamo al nostro consueto
esempio: se portiamo una foto di come appare la corografia da un elicottero non
saremo immediatamente in grado di convertirla in un insieme di istruzioni da dare
ai tifosi su come organizzarsi. Però, è evidente, sapremo cosa vogliamo ottenere e
potremo correggere velocemente i tentativi di organizzazione che i tifosi
tenteranno. Sono comunque abbastanza convinto che il recupero impieghi più
11
rappresentazioni associate che guidano la costruzione della rappresentazione da
recuperare. In questo modo ci sono maggiori probabilità di dare vita al codice
implicito «giusto», se questo nasce in più aree. Questo potrebbe essere uno dei
motivi che spiega la maggiore attivazione di aree cerebrali in compiti di recupero
rispetto all’attivazione durante l’apprendimento [cfr. Nyberg 1996, 11284]; inoltre
si spiega il fatto che il recupero sia sottoposto ad una variabilità abbastanza
elevata, soprattutto di fronte ad immagini.
2.4 Un modello simile: la teoria SOC
Ho avuto poi modo di incontrare un modello che ritengo possa avere
alcune affinità con il mio. Lo cito perché gli autori presentano molte riflessioni e
dati sperimentali che possono arricchire la mia proposta. In effetti nella teoria
SOC (Self Organizing Consciousness40) di Perruchet e Vinter il ruolo delle
rappresentazioni coscienti è decisivo: «la vita mentale è assunta essere coestensiva
con la coscienza»41.
Fin dalla definizione di rappresentazione è possibile annoverare delle analogie:
«la parola rappresentazione designa un evento mentale che presuppone il ruolo di
alcuni componenti significativi del mondo rappresentato (ad esempio una persona,
un oggetto, un movimento, una scena) all'interno del mondo rappresentante»42. La
teoria SOC propone che il cervello si auto-organizzi utilizzando le
rappresentazioni coscienti come unità fondamentali: «il nostro approccio consiste
nel mostrare come un largo numero di fenomeni che sembrano richiedere processi
basati su regole di astrazione inconsce, inferenze, analisi, ed altre operazioni
implicite complesse, possano essere descritti dalla formazione di rappresentazioni
conscie che sono isomorfe alla struttura del mondo»43.
L’apprendimento si spiega secondo principi associativi: «il punto centrale
è che ogni esperienza conscia innesca meccanismi di apprendimento associativo
che prendono come componenti questa esperienza come ‘materiale’ su cui
operare»44. L’associazione comprende rappresentazioni di complessità variabile,
originate secondo una dinamica combinatoria: «[…] la rappresentazione di eventi
esterni può essere abbastanza complessa. […] possono essere rappresentazioni di
combinazioni o configurazioni di stimoli elementari»45.
La differenza tra il modello SOC e la mia proposta sta in gran parte
nell’origine dei dati e nei diversi argomenti portati a supporto: il loro lavoro si
basa su dati psicologici (il fenomeno della «diminuzione del trasferimento») e sul
successo di un programma di estrazione parole basato sul modello; il mio porta
soprattutto considerazioni basate sui codici popolazionali, e sulla dinamica
cerebrale (sincronizzazione o policronizzazione). Certamente i due modelli sono
integrabili senza difficoltà, e possono essere utili per una diversa concezione delle
rappresentazioni all’interno della filosofia della mente.
2.5 Metarappresentazioni e sistemi di molte rappresentazioni
Sarebbe tuttavia semplicistico pensare di esaurire l’enorme complessità di
comportamento e le grandi capacità elaborative del cervello nel solo modello
associativo intermodale fin qui proposto. Per prima cosa occorre pensare che un
12
sistema che funzioni associando tra loro rappresentazioni prodotte combinando
parti più semplici potrebbe facilmente dar luogo a metarappresentazioni:
all’interno di una modalità, oppure multimodali. L’associazione di due o più
rappresentazioni può essere organizzata aggiungendo ad esse un’ulteriore
rappresentazione che ne conservi i codici e sia in grado di riattivare, magari in una
precisa sequenza temporale, le rappresentazioni che ne dipendono. Una
rappresentazione come la parola «più» (intesa come somma) può essere usata per
organizzare rappresentazioni come le parole «uno», «due» (etc). Secondariamente,
penso sia lecito immaginare che esistano delle combinazioni multiple: per
esempio, perché si attivi una rappresentazione è necessario che si attivino prima
altre due rappresentazioni. Per ricordare il volto di mia nonna Maria occorre che si
attivino prima le due rappresentazioni fonologiche «nonna» e «Maria». Se si
attivasse solo la prima non sarei in grado di estrarre un’informazione
sufficientemente precisa.
3 UN ULTIMO SFORZO: EQUILIBRI E DINAMICHE
Ho già introdotto il discorso sulla stabilità degli aggregati. Non sono
entrato più di tanto nei dettagli. L’idea intuitiva che c’era alla base è molto
semplice: non ha senso associare tra loro degli insiemi disordinati: non possiamo
associare due puzzle incompleti. In questa sezione purtroppo sarò costretto a dare
molte conoscenze per scontate; decisamente è la parte più difficile del capitolo.
Mi scuso subito se alcune parti sembreranno incomprensibili.
Come ripeto ora, per la mia proposta è fondamentale che i due aggregati
che si associano siano stabili per il tempo necessario all’associazione. Alcune
considerazioni di importanti neuroscienziati rimarcano questo fatto: «per poter
prendere delle decisioni sulla base di una rappresentazione (basata su qualia), la
rappresentazione deve esistere abbastanza a lungo da permettere ai processi
esecutivi di lavorarci»46 [Ramachandran 1997, 438]. Ipotizzo che debba esistere
abbastanza a lungo da potersi associare con altre rappresentazioni; Grossberg
[1999, 2] conferma, in altri termini, la proposta di Ramachandran: «prima che
un’intera composizione di suoni, come la parola VAI, possa essere elaborata come
un tutto, è necessaria una ricodifica, ad un livello successivo di elaborazione, in
uno schema spaziale di attivazione disponibile simultaneamente»47. Potrei
intepretare così Grossberg: perché l’attività di una popolazione di neuroni venga
riconosciuta come un unicum da altre aree cerebrali occorre che sia «disponibile
simultaneamente», sia cioè mantenuta costante (ripetendo i patterns di scarica) il
tempo sufficiente per creare attivazione (tramite risonanza) in altre aree.
Se entrambi gli aggregati sono delle combinazioni di blocchi più piccoli
occorre che queste combinazioni siano «congelate» per un tempo sufficiente. Sarò
sincero, non ho una soluzione sicura e facile per questo problema. Si potrebbe
benissimo sostenere che la difficoltà di questo problema sia uno dei punti deboli
del mio modello. Penso però che siano possibili almeno diverse spiegazioni
valide, e qui di seguito ne passo in rassegna alcune; in molti casi posso solo
indicare una via e mostrare cosa possa renderla attraente. Potrebbe anche darsi che
siano richiesti più fenomeni per permettere quel miracolo di precisione richiesto
dall’associazione tra gruppi combinati.
13
3.1 Percorsi privilegiati
Visto che le rappresentazioni nuove si inseriscono su quelle vecchie, in
realtà a variare saranno le combinazioni, e non ci saranno, da un certo momento
dello sviluppo, forti variazioni a livello strutturale e di connessioni. I percorsi di
legame tra aree multimodali hanno una forte dose di «preferenzialità», se mi è
concesso il termine, quindi non occorrono particolari modifiche che portino alla
creazione di nuovi legami associativi tra rappresentazioni.
L’idea è che la presenza di forti relazioni gerarchiche all’interno delle aree
unimodali e tra unimodali e multimodali possa favorire lo sviluppo di legami tra
le componenti delle rappresentazioni; si tratta quindi di rimescolare un alfabeto
non molto numeroso e, soprattutto, all’interno del quale le variazioni sono
fisicamente vincolate dalle connessioni impiegate. Per capirci, potrebbe benissimo
darsi che una classe di immagini sia connessa con una classe di parole
semanticamente inerenti. Non sarà molto difficile imparare nuove immagini o
nuove parole: gran parte dei collegamenti sono già presenti. Occorrono più che
altro delle corrette relazioni da un punto di vista temporale: occorre che questo
alfabeto sia precisamente ricombinato ogni volta. Ritengo che questa soluzione
abbia una dose di plausibilità: i principi gerarchici sembrano poter spiegare bene
fenomeni come la categorizzazione.
3.2 Ippocampo
In realtà l’iniziale memoria delle due rappresentazioni si fissa
nell’ippocampo, poi, con gli anni, emerge nelle associazioni tra aree nella
corteccia. Ma non c’è un accordo assoluto sul ruolo dell’ippocampo, e, per di più,
alcune forme di memoria non sembrano interessate dall’ippocampo quanto altre48.
Il mio punto di vista è questo: l’associazione tra rappresentazioni nella
corteccia deve avere luogo. Perché altrimenti non si spiegherebbe il ragionamento.
E sono convinto che abbia luogo abbastanza in fretta. Quindi pensare che sia
l’ippocampo ad assolvere il compito di fissare per un po’ le combinazioni non mi
sembra un’utile soluzione.
3.3 Mancanza di una visione «diluita nel tempo»
In realtà la combinazione tra due aggregati richiede del tempo o del
rehearsal49. Non solo, deve essere ripetuta abbastanza spesso. Si spiegherebbe
così il fenomeno della specializzazione, ossia il fatto che ogni persona sia più
pronta e rapida nel ragionamento se ha a che fare con materie che conosce,
piuttosto che con materie studiate nel passato. La soluzione starebbe nell’esercizio
(e quindi irrobustimento) continuo di certe associazioni a svantaggio di altre
(indebolite dalla long-term depotentiation).
Ho introdotto questa considerazione pensando al fatto che non
sperimentiamo ripetizioni a livello cosciente durante il nostro apprendimento e
durante il recupero. Ma mi sono reso conto che allo stesso modo non
sperimentiamo l’attività di integrazione di qualità diverse; questa non è quindi una
grande obiezione. Probabilmente la ripetizione delle associazioni, combinata con
14
meccanismi di depotenziamento (quali quelli probabilmente presenti nel sonno) è
una valida risposta ai miei problemi di come spiegare l’apprendimento.
3.4 Il sonno
Potrebbe darsi che il sonno serva a riequilibrare le sinapsi50, abbassando
quelle che non sono state utilizzate, oppure forzando quelle che si sono appena
stabilite. Non c’è un’opinione condivisa su questi meccanismi. Penso che un
simile meccanismo possa in parte spiegare l’apprendimento di associazioni,
mediante il ridimensionamento di quelle che non vengono impiegate, ed essere
un’illuminante modo di comprendere il motivo per cui sogniamo: riattiviamo le
rappresentazioni per rinforzare i percorsi che hanno iniziato a formarsi di giorno.
Ma, dato che questa riattivazione non è pilotata e precisa, in realtà si attivano
anche molte rappresentazioni non direttamente implicate.
3.5 Sincronizzazione
A favore della sincronizzazione come sistema di binding ci sono molti dati
e molte teorie. Ma sollevo una questione: se due sistemi appartenenti a due
diverse modalità si coordinano e si equilibrano vicendevolmente non si rischia di
avere una eccessiva influenza reciproca, tale da compromettere la fedeltà allo
stimolo? Ho trovato una possibile risposta, confortante, nelle dispense del corso di
«Caos deterministico e applicazioni»: «la sincronizzazione completa preserva la
caoticità del movimento dei due sistemi» [Piccardi 2006]. Ciò potrebbe significare
che la sincronizzazione completa tra i due sistemi costituiti dalle due
rappresentazioni preserva l’unicità dei due sistemi nella formazione della propria
rappresentazione unimodale. Purtroppo la sincronizzazione completa richiede
l’identità dei due sistemi, e mi sembra questa una richiesta molto forte. Non è
naturalmente possibile indagare fino in fondo questa tematica, ma potrebbe essere
un terreno decisamente interessante.
3.6 Attrattori
«Un attrattore è un insieme verso il quale evolve un sistema dinamico
dopo un tempo sufficientemente lungo» [da Wikipedia]. Il motivo per cui
introduco il seguente concetto dipende dalla sua capacità di rispondere alle
esigenze tipiche di una rappresentazione distribuita, dato che sa giustificarne le
caratteristiche salienti: unità e discretezza (una rappresentazione è, da un punto di
vista cognitivo, un’unità indivisibile e in sè completa) e, soprattutto, sa essere
abbastanza flessibile da mantenere questa unità anche di fronte a sottili variazioni
a livello strutturale (nel numero dei neuroni connessi, nelle differenze nei
patterns di scarica). Nelle parole di Treves: «l’elemento cruciale perché questo
accada è la natura discreta degli attrattori del network locale. La discretezza degli
attrattori locali può fornire la capacità di correzione di errori e la robustezza al
rumore che sono spesso associate con l’elaborazione di simboli discreti»51 [Treves
2005, 279]. Il sistema dinamico costituito dai neuroni che scaricano tende a
15
raggiungere il medesimo attrattore, anche se parte da condizioni di volta in volta
leggermente differenti. Mi sembra molto favorevole a spiegare la costanza
simbolica del mentale, il fatto che rievochiamo gli stessi simboli più volte senza
variazioni evidenti. Nelle parole di Calvin questi fenomeni sono ancora più chiari:
La cattura è un altro aspetto della risonanza e degli attrattori che può essere utile
qui: una sequenza spaziotemporale che arriva molto vicina ad una sequenza dell’attrattore
può essere modificata in conformità con quella dell’attrattore. Quando ti senti catturato da
questa strada scivolosa, è perché sei stato realmente forzato in un attrattore. Questa
convergenza è un altro modo di dire che gli attrattori hanno un bacino di attrazione, un
ampio insieme di condizioni iniziali che portano tutte alla fine allo stesso attrattore52.
Eppure il problema degli attrattori è che quelli caotici non sono un
equilibrio: le rappresentazioni non sarebbero stabili, bensì varierebbero secondo la
«legge» dell’attrattore. Due rappresentazioni governate da attrattori caotici si
invieranno dei patterns continuamente variabili. Questo rende impossibile la
formazione di associazioni stabili a livello sinaptico. Però potrebbe significare che
la memorizzazione su base associativa richieda la ripetizione nel corso della vita
dell’associazione. Invece di una ripetizione nel breve termine occorre una
ripetizione nel lungo termine.
Esprimermi ora su queste tematiche mi sembra sinceramente prematuro,
ma non v’è dubbio alcuno sull’importanza che gli studi sul caos rivestono nel
panorama delle neuroscienze.
4 CONCLUSIONI
Ho cercato di presentare un’idea di rappresentazione che sia capace di
essere fedele al lato neurobiologico ma al tempo stesso di conservare il suo
carattere simbolico. Nel farlo ho dovuto affrontare due problemi, la distinzione e
la memorizzazione; ho proposto che l’associazione tra rappresentazioni di diverse
modalità possa essere una soluzione. Una rappresentazione fonologica già
ordinata ordinerà una rappresentazione visiva in formazione. Naturalmente questo
è valido anche nei compiti di recupero in memoria: per riattivare l’immagine di un
ricordo attiverò prima una parola, o un insieme di parole, che possano descrivere
la scena. Uno dei motivi per cui ritengo interessante la mia proposta sta nell’idea
che ho che la memoria giochi un ruolo fondamentale nel pensiero; come afferma
Treves [1998, 154]: «[…] molte funzioni corticali, se osservate sufficientemente
in astratto, sono scomponibili in un numero ristretto di operazioni, di cui le
principali sono l’individuazione o categorizzazione e l’associazione. Entrambe
sono fondamentalmente operazioni di memoria».
Penso che dare una spiegazione basata su rappresentazioni possa essere un
buon modo per conciliare diverse prospettive e fenomeni; per avvicinare il piano
neurale a quello mentale (simbolico e cosciente).
Per quanto la mia proposta richieda sicuramente molti raffinamenti spero
possa almeno servire da spunto per altre idee, magari più precise ed
empiricamente supportate.
16
Note
1
«A representation can be any physical object or state that is somehow made to stand-in for (i.e.
're-present') some other physical object or state (or extremely complex disjunction of states or
objects -- including abstract objects, such as numbers)» Dizionario online di filosofia della mente.
(http://www.artsci.wustl.edu/~philos/MindDict/representation.html)
2
Una rappresentazione possiede un contenuto, un referente (l’oggetto rappresentato), delle
condizioni di verità (in quali casi la rappresentazione è vera o falsa) il valore di verità (quando la
rappresentazione ci parla correttamente della realtà esterna); una buona trattazione delle
rappresentazioni mentali si può trovare a questo indirizzo: http://plato.stanford.edu/entries/mentalrepresentation/
3
Il mio interesse verso le rappresentazioni è, in questo capitolo, eminentemente funzionale: le
considero dei «mattoni di informazione« che le diverse aree cerebrali producono e condividono per
svolgere le funzioni cognitive richieste dall’ambiente. Quindi mi occupo soprattutto delle modalità
organizzative, non delle relazioni che le rappresentazioni hanno con il mondo esterno.
4
Risulta evidente la scelta di legare dato psicologico e biologico; mi allontano da un approccio
psicologistico o estremamente filosofico.
5
Occorre una comprensione intuitiva del termine in questo contesto: pensiamo alla nostra
esperienza.
6
A titolo meramente speculativo ritengo però interessante riflettere sui neuroni specchio: gli studi
del gruppo di Parma hanno evidenziato come i gruppi di neuroni nelle cortecce pre-motorie
codifichino atti (come «afferrare per mangiare», «prendere con precisione»); gli atti sembrano
essere abbastanza complessi e, soprattutto, sembrano inserirsi perfettamente nella logica con cui
ragioniamo coscientemente: per questo potrebbero nascere da collegamenti con rappresentazioni e
comportarsi come rappresentazioni.
7
Cfr. Edelman, Tononi [2000, 136-7].
8
Cfr. Un ultimo sforzo: equilibri e dinamiche, pag. 13.
9
Penso che alcune riflessioni interessanti in proposito possano essere trovate nei lavori di Francis
Crick e Christof Koch: cfr. Metzinger [2000, 104-6]; rimando poi all’ultimo lavoro di Koch
[2004].
10
Da filosofo so quanto il concetto di indiscutibilità sia privo di senso; il mio ragionamento è
dettato da esigenze divulgative e pragmatiche; in pratica non intendo far finta che i qualia non
esistano, visto che li citerò spesso, ma neppure posso fare uno studio unicamente sulla coscienza.
11
Ma ci sono interessanti tentativi: cfr. Holoyak, Hummel [2003]; Cleeremans [1993].
12
Cfr. ancora Edelman, Tononi [2000, 136-7].
13
Non vorrei risultare pedante, ma occorre capire che serve un’organizzazione precisa perché
possano nascere scritte diverse con lo stesso materiale a disposizione.
14
«In assembly coding, two important constraints need to be met. First, a selection mechanism is
required that permits the dynamic yet consistent association of neurons into distinct, functionally
coherent assemblies. Second, responses of neurons that have been identified as groupable must be
labelled so that they can be recognized by subsequent processing stages as belonging together».
15
Difficile sapere come identificare questi sottogruppi e di cosa siano costituiti; sono qualità base
(qualia)? Sono simboli? Per ora cito questa frase: «Il concetto di semiconnettività comporta, al
livello dei circuiti locali, che neuroni adiacenti abbiano le stesse proprietà di risposta (ad esempio
l’orientamento delle colonne nella corteccia visiva primaria) laddove neuroni leggermente distanti
possono avere caratteristiche di risposta sovrapponibili, ma non identiche». [McIntosh 2000, 862]
Penso quindi che neuroni adiacenti codifichino la stessa qualità e che un raggruppamento dia vita a
diverse rappresentazioni a seconda di come e con chi si combini.
16
«Sequenze» è forse il termine migliore in questo contesto.
17
«According to this class of theories, visual long-term memories of shapes are stored in an
abstract code in the inferior temporal lobes. At least in the monkey brain, such memories are
stored using a population code; activation in sets of columns—not patterns of activation in
topographically organized areas—specifies shape. […] the local geometry of shapes is only
implicit in the longterm memory (LTM) representation, and is made explicit by generating patterns
of activation in topographically organized early visual cortex».
18
La mia è una metafora: occorre evitare di pensare ad una qualche intenzionalità dei neuroni.
17
Un dettaglio tecnico: simbol tokens significa proprio avere a che fare con corrispettivi fisici,
organizzazioni di aggregati neurali; la rappresentazione codificata raccoglie la complessa struttura
composizionale.
20
«Van Gelder (1990) has expressed this distinction by noting that the connectionist
implementations of compositional structure have used “functional compositionality”, rather than
the “concatenative compositionality” that has been used in more traditional AI approaches.
Functional compositionality is achieved by the use of (possibly quite complex) functions which
operate on symbol tokens, and produce a coded representation of a complex compositional
structure. These models differ from the symbolic models in that the compositional representation
need not contain explicit physical tokens of the original constituents, but may instead only contain
the original information in a very implicit way».
21
Cercherò di presentare una modalità di apprendimento che deriva dall’associazione tra modalità
diverse (p. es. associo un’immagine al suo nome); non mi occupo dell’apprendimento unimodale
(p. es. associare una nuova parola al lessico preesistente). Ma non penso che nel caso
dell’apprendimento unimodale il meccanismo sia troppo diverso: «Abbiamo sviluppato un
modello del loop fonologico [meccanismo di ripetizione] che ottiene il binding utilizzando diversi
substrati neurali a seconda delle diverse posizioni, in sequenza, dei fonemi» [O’Reilly 2001, 3].
22
«Everyday experiences unfold in multiple modalities. The establishment of a durable record of
experience, and its associative incorporation into the existing base of knowledge, necessitate
multimodal integration».
23
«Transmodal areas are not necessarily centres where convergent knowledge resides, but critical
gateways (or hubs, sluices, nexuses) for accessing the relevant distributed information».
24
Ad esempio le moltiplicazioni richiedono l’uso di rappresentazioni fonologiche, essendo basate
sull’apprendimento e la combinazione delle «tabelline«; cfr. Dehaene [2003].
25
«The subject first has to translate the visual letter representations into their corresponding
phonological representations (the names of the letters)».
26
«This raises the possibility that the parietal area of interest may be activated in our neuroimaging
studies because it is part of the circuitry involved in translating the visually presented verbal
materials into a phonological code, and then the area simply remains active for a few seconds,
where this persistence of activity constitutes the pure storage function of verbal WM».
27
«[…] inferotemporal activations, due to object recognition, were profoundly modulated by
phonological retrieval of the object’s name».
28
Una breve pausa per capire il significato di «risuona«; alcuni corpi rigidi che possono vibrare
hanno delle frequenze di vibrazione precise e costanti: se, ad esempio, prendiamo due diapason di
frequenza uguale, li avviciniamo e ne mettiamo uno in vibrazione otterremo, dopo un breve
intervallo, vibrazioni della stessa frequenza anche nell’altro diapason; l’idea di Izhikevich è simile:
i gruppi rispondono a degli input che corrispondono alla frequenza propria che fa risuonare il
diapason.
29
«Learning of a new input consists of selecting and reinforcing an appropriate group (or groups)
that resonates with the input».
30
«Assigning the representation (meaning) to the group consists of potentiating weak connections
that link this group with other groups coactive at the same time, that is, putting the group in the
context of the other groups that already have representations». Fuster [2002, 14] conferma, in altri
termini, l’idea di Izhikevich: «l’esperienza in atto viene incorporata, attraverso lo sviluppo di
nuove connessioni, in una rete prestabilita. Ogni nuova esperienza si installa su un substrato di
memoria più antica, evocata per somiglianza. La convergenza sincronica è, in ogni caso, il
principio chiave perché si formi la nuova rete mediante la coincidenza temporale
dell’informazione nuova con quelle della rete antica riattivata».
31
Ricordando che i costituenti sono qualia o simili (cfr. nota pag. 7), il significato immediato di
una rappresentazione potrebbe essere nella sua stessa presentazione, nel modo in cui viene esperita
dal soggetto; naturalmente occorre anche tenere in considerazione molti altri fattori che non posso
ora analizzare, mi limito a citare contesto e legame con il mondo esterno.
32
TEO and V4 were thus characterized by the mixture of cells with various levels of selectivity.
We may take this mixture of various cells as evidence that selectivity is constructed through local
networks in these regions. If we randomly sample cells from a local network in which the selective
responses to complex features are constructed by integrating simple features, the sample should
include cells with various levels of selectivity. Cells located close to the input end should be
maximally activated by simple features, cells close to the output should respond only to the
complex features, and cells at intermediate stages should show some intermediate properties. The
areas that satisfy this condition were TEO and V4.
19
18
33
«Every time the input is presented to the network, a polychronous group (or groups) whose
spike-timing pattern resonates with the input is activated (i.e., the neurons constituting the group
polychronize)».
34
Aree di Broadmann 17 e 18, aree di elaborazione visiva primaria.
35
Conservante le relazioni spaziali presenti nell’oggetto.
36
Almeno due modelli influenti descrivono il riconoscimento secondo una logica combinatoria:
cfr. Treisman e Gelade [1980], Biederman [1987].
37
Spiegherò con dettagli tecnici questo discorso; per ora accontentiamoci di una comprensione
intuitiva: per associare due puzzle devo averli finiti, non ha senso associarli con tessere mancanti!
38
Cfr. D’Angelo et al. [2002, 24]; cfr. Conti [2005, 190]; detto molto semplicemente: il
rafforzamento a lungo termine richiede frequenze elevate nelle scariche tra neuroni; perché si
abbiano frequenze elevate è sensato pensare ad una ripetizione dello stesso treno di scariche più
volte.
39
Sebbene mi sia occupato soprattutto di Izhikevich il concetto di risonanza appare essere diffuso
nella comunità neuroscientifica: rimando a Lamme [2004], Pollen [2003], Dehaene et al. [2006].
In questi lavori l’attivazione risonante sembra essere una condizione dell’esperienza cosciente.
40
Coscienza auto-organizzante.
41
«Mental life is posited as co-extensive with consciousness» [Perruchet, Vinter, 2002, 299].
42
«The word representation designates a mental event that assumes the function of some
meaningful component of the represented world (e.g. a person, an object, a movement, a scene)
within the representing world». (ibidem)
43
«Our approach consists in showing that a large number of phenomena that seemingly require
unconscious rule of abstraction processes, inferences, analyses, and other complex implicit
operations, can be accounted by the formation of conscious representations that are isomorphic to
the world structure». 301.
44
«The key point is that each conscious experience triggers associative learning mechanisms that
take the components of this experience [l’esperienza conscia] as the ‘stuff’ on which they
operate«. 302.
45
«The representation of external events […] may be quite complex. […] they may be
representations of combinations or configurations of […] elementary stimuli» (p. 303).
46
«In order to make decisions on the basis of a qualia-laden representation, the representation
needs to exist long enough for executive processes to work with it».
47
«Before an entire pattern of sounds, such as the word GO, can be processed as a whole, it needs
to be recoded, at a later processing stage, into a simultaneously available spatial pattern of
activation».
48
Cfr. Treves 1998.
49
Ripetizione, a voce alta o «a mente» di una parola, una frase, un insieme di numeri, al fine di
favorirne la memorizzazione.
50
Cfr. Huber, 2004.
51
«The crucial element for this to occur is the discrete nature of local network attractors. The
discreteness of local attractors can provide the error correction capability and the robustness to
noise that are often associated with the processing of discrete symbols».
52
«Capture is another aspect of resonance/attractors that will be useful here: a spatiotemporal
pattern that comes close to an attractor’s pattern will be altered to conform with that of the
attractor. When you feel captured by that washboarded road, it’s because you really are being
shoehorned into an attractor. This convergence is another way of saying that attractors have a basin
of attraction, a wide set of starting conditions that all eventually lead into the same attractor
cycle» [http://williamcalvin.com/bk9/bk9ch5.htm].
19
BIBLIOGRAFIA
Baddeley, A.
1996
Biederman, I.
1987
Chalmers, D.J.
1990
Cleeremans, A.
1993
The fractionation of working memory, in «Proc. Natl. Acad.
Sci. USA», vol. 93, n. 24, pp. 13468-13472.
Recognition-by-components: A theory of human image
understanding, in «Psychological Review», vol. 94, n. 2,
pp. 115-147.
Syntactic Transformations on Distributed Representations,
in «Connection Science», vol. 2, pp. 53-62.
Mechanism of Implicit Learning, Cambridge MA, The MIT
Press.
Conti, F., (a cura di)
2005
Fisiologia Medica (I volume), Milano, Edi-ermes.
D’Angelo, E., Rossi, P., Taglietti, V.
2002
Dalle sinapsi alla memoria, in «Le Scienze Dossier», n. 14,
pp. 20-25.
Dehaene, S., Piazza, M., Pinel P. and Cohen, L.
2003
Three parietal circuits for number processing,
«Cognitive Neuropsychology», n. 20, pp. 487-506.
in
Dehaene, S., Changeux, J.-P., Naccache, L., Sackur, J, and Sargent, C.
2006
Conscious, preconscious, and subliminal processing: a
testable taxonomy, in «Trends in Cognitive Sciences», vol.
10, n. 5, pp. 204-211.
Edelman, G.M., Tononi, G.
2000
A universe of consciousness. How matter becomes
imagination, Basic Book, New York, (tr. it. a cura di
Ferraresi, S., Un universo di coscienza. Come la materia
diventa immaginazione, Torino, Einaudi, 2000).
Fuster, J.M.
2002
La localizzazione della memoria, in «Le Scienze Dossier»,
n. 14, pp. 12-19.
Friston, K.J., Price, C.J., Fletcher, P., Moore, C., Franckoviak R.S.J. and Dolan,
R.J.
1996
The trouble with cognitive subtraction, in «Neuroimage»,
Vol. 4, n. 2, pp. 97-104.
20
Grossberg, S.
1999
The link between brain learning, attention and
consciousness, in «Consciousness and Cognition», n. 8, pp.
1-44.
Houdé, O., Kayser, D., Koenig, O., Proust J., Rastier, F.
1998
Vocabulaire de sciences cognitives, Paris, Presses
Universitaires de France, (tr. it. a cura di Quintili, P.,
Dizionario di scienze cognitive, Roma, 2000).
Huber, R., Ghilardi F.M., Massimini M. and Tononi G.
2004
«Local sleep and learning», Nature, n. 430, pp. 78-81.
Hummel J.E., Holyoak J.K.
2003
A Symbolic-Connectionist Theory of Relational Inference
and Generalization, in «Psychological Review», vol. 110,
n. 2, pp. 220-264.
Izhikevich, E.
2006
Koch, C.
2004
Polychronization: Computation with spikes, in «Neural
Computation», n. 18, pp. 245-282.
The Quest for Consciousness: A Neurobiological
Approach, Roberts & Company Publishers.
Kosslyn S.M., Thompson W.L.
2003
When Is Early Visual Cortex Activated During Visual
Mental Imagery?, in «Psychological Bulletin Copyright»,
vol. 129, n. 5, pp. 723-746.
Lamme, V.A.F.
2004
McIntosh A.R.
2000
Mesulam, M.M.
1998
Metzinger, T.
2000
Separate neural definition of visual consciousness and
visual attention; a case for phenomenal awareness, in
«Neural Networks», vol. 17, n. 5-6, pp. 861-872.
Towards a network theory of cognition, in «Neural
Networks», vol. 13, n. 8-9, pp. 861-870.
From
sensation
to
vol. 121, pp. 1013-1052.
cognition,
in
«Brain»,
Neural Correlates of Consciousness: Empirical and
Conceptual Questions, Cambridge MA, The MIT Press.
Nyberg, L., McIntosh, A.R., Cabeza, R., Habib, R., Houles, S., Tulving, E.
21
1996
General and specific brain regions involved in encoding
and retrieval of events: What, where, and when, in «Proc.
Natl. Acad. Sci. USA», vol. 93, no20, pp. 11280-11285.
Perruchet, P., Vinter, A.
2002
The self-organizing consciousness, in «Behavioral and
Brain Sciences», n. 25, pp. 297-330.
Piccardi, C.
2006
Sincronizzazione in dispense per il corso di «Caos
deterministico e Applicazioni», Politecnico di Milano.
Ramachandran, V.S., Hirstein, W.
1997
Three Laws of Qualia, in «Journal of Consciousness
Studies», vol. 4, n. 5-6, pp. 429-458.
O’Reilly, R.C., Busby, R.S., Soto, R.
2001
Three Forms of Binding and their Neural Substrates:
Alternatives to Temporal Synchrony, (Capitolo sottoposto
a: Cleeremans, A. (a cura di), The Unity of Consciousness:
Binding, Integration, and Dissociation, Oxford, Oxford
University Press, 2003).
Singer, W.
1998
Consciousness and the structure of
neuronal
Representations, in «Phil.Trans. R. Soc. Lond. B», n. 353,
pp. 1829-1840.
Smith, E., Jonides, J.
1998
Neuroimaging analyses of human working memory, in
«Proc. Natl. Acad. Sci. USA», vol. 95, pp. 12061-12068.
Treisman, A.M., Gelade, G.
1980
A feature-integration theory of attention, in «Cognitive
Psychology», n. 12, pp. 97-136.
Treves, A.
2005
Treves, A.
1998
Turing, A.M.
1950
Frontal latching networks: a possible neural basis for
infinite recursion, in «Cognitive Neuropsychology», vol.
22, pp. 276-291.
Come funziona la memoria, Milano, Bruno Mondadori.
Computing machinery and intelligence, in «Mind», n. 59,
pp. 433-460.
Vallar, G.
22
2006
Memory systems: The case of phonological short-term
memory. A festschrift for Cognitive Neuropsychology, in
«Cognitive Neuropsychology», vol. 23, n. 1, pp. 135-155.
23